Capítulo 6: La edición digital

283

6. La edición digital

JOSÉ MANUEL BARRUECO

Capítulo 6

La edición digital (José Manuel Barrueco) 285

La edición digital: Introducción 285

Desde lo analógico a lo digital: guía de digitalización de documentos 286

La planificación del proyecto de digitalización 287

Equipamiento 288

Selección de materiales 289

El escaneado 290

El OCR (Optical Character Recognition) 291

Control de calidad 291

Metadatos 292

Presentación y publicación 293

Gestión 294

Desde el archivo digital al soporte digital 295

El diseño de la estructura del documento 296

Documentos de texto no estructurados 297

Documentos estructurados 301

Los formatos de imagen 307

Documentos multilingües 311

El diseño de la presentación 313

Hojas de estilo 313

Tipos de visualización 315

Uso de buscadores 317

La adición de valor: metadatos 318

Estándares de accesibilidad y usabilidad 320

LA EDICIÓN DIGITAL: INTRODUCCIÓN

Durante los últimos diez años en el área de la edición científica, los contenidos digita-les han experimentado un fuerte crecimiento, motivado por la generalización del uso y elaumento de la velocidad de acceso a Internet. Cualquier tipo de documento, que tradi-cionalmente se ha publicado en formato impreso, puede tener una representación digital yestar al alcance de una audiencia potencial de millones de usuarios con una inversiónreducida.

En paralelo, el desarrollo de aplicaciones informáticas multimedia ha permitido la apa-rición de nuevas tipologías documentales como aplicaciones interactivas, animaciones osimulaciones en 3D. No obstante, este incremento no ha estado exento de problemas nise ha dado por igual en todos los tipos documentales ni disciplinas científicas. Mientras encasos como las obras de referencia o las revistas científicas las versiones digitales estánrelegando a las impresas, el desarrollo de libros electrónicos sigue teniendo una acepta-ción muy limitada.

La edición científica de contenidos digitales tiene ventajas e inconvenientes. Entre losprincipales inconvenientes1 tenemos:

Control de los derechos de copia. Es prácticamente imposible evitar la copia de un documento electrónico.

Falta de normalización. Existen multitud de formatos y estándares que estáncompitiendo para hacerse un hueco en el mercado de la edición digital.

Como puntos a favor cabría destacar:

Portabilidad. Una vez que un documento está en formato digital es fácil reproducirloen diferentes formas en función de las necesidades de la audiencia (Braille, impre-sión bajo demanda, contenido web, etc.).Renovación. El concepto de «obra» agotada podría desaparecer ya que aquellos libros agotados podrían volver a la vida si se digitalizan y distribuyen electrónicamente.

Mejoras. Los documentos electrónicos tienen características nuevas no disponibles en el papel como, por ejemplo, los enlaces hipertextuales o las animaciones.Además, es mucho más barato producir documentos electrónicos en color que docu-mentos impresos en color.

Difusión. Si se colocan en la red la audiencia potencial de los documentos es mayorque en cualquier documento impreso.

En la actualidad estamos en una época de transición del medio impreso al digital quellevará aún cierto tiempo completar. Durante la misma, ambas tecnologías coexistirán enun entorno híbrido. En general, cada servicio de publicaciones tendrá que tomar sus pro-pias decisiones y definir la política a seguir en cuanto a edición digital. En cualquier caso,está claro que la opción que se plantea no es publicar en digital o no, sino que la verdade-ra cuestión será «cuándo» comenzar. La opción de la edición digital, a medio plazo, seconvertirá en inevitable. Cuando esto suceda, será útil realizar un acercamiento pragmáti-co y cuidadosamente organizado.

285

El presente capítulo está destinado a ayudar a localizar todos los recursos técnicosnecesarios para comenzar a publicar en formato digital. Para ello se ofrecen una serie derecomendaciones a seguir para la creación de documentos digitales. Se han diferenciadodos tipos de documentos digitales en función de su origen. En primer lugar tratamos lasrepresentaciones digitales de documentos impresos, esto es, los documentos digitaliza-dos. En segundo lugar, los que han sido diseñados y creados en formato digital desde suorigen.

DESDE LO ANALÓGICO A LO DIGITAL: GUÍA DE DIGITALIZACIÓN DE DOCUMENTOS

La digitalización es aquel proceso que comprende todos los pasos necesarios parahacer disponibles en formato digital documentos que se encuentran en formato impreso oen cualquier otro formato analógico (audio, vídeo, etc.). En esta guía nos centramos exclu-sivamente en documentos impresos. A grandes rasgos la cadena de digitalización se concretaen los siguientes pasos: redacción de un plan del proyecto, selección del equipamientonecesario, selección de los materiales a digitalizar, escaneado de los mismos y opcional-mente conversión a texto a través de un proceso de OCR (Optical CharactersRecognition), control de calidad de los resultados, adición de metadatos, presentación ypublicación.

La digitalización del patrimonio documental es una de las prioridades de la política cul-tural de la Unión Europea en relación con la sociedad de la información2. Esta preocupaciónpor poner a disposición del público versiones electrónicas de documentos, tanto históricos(archivos) como clásicos o fondo antiguo (bibliotecas) es compartida también por gobier-nos a nivel internacional así como por universidades y otros agentes culturales. Esto haceque se hayan realizado múltiples guías de buenas prácticas y recomendaciones sobre digi-talización. Una lista de las mismas ha sido recopilada por el proyecto Minerva3 de la UniónEuropea.

Para la elaboración de este capítulo hemos utilizado como base algunas de estasobras. Entre ellas:

Good Practices Handbook, realizado por Minerva Europe4. Este documento es el resultado del grupo de trabajo sobre buenas prácticas dentro del proyecto Minervafinanciado por la Unión Europea. Presenta un manual práctico para el establecimien-to, ejecución y gestión de proyectos de digitalización. No es un documento técnicodado que todas las cuestiones técnicas se han especificado en un informe tituladoTechnical Guidelines for Digital Cultural Content Creation Programmes5.

Las especificaciones de la IFLA (International Federation of Libraries Associations)6.Elaboradas por un grupo de trabajo conjunto de la IFLA y el Consejo Internacionalde Archivos (CIA) y financiado por la UNESCO. Identifican y discuten los aspectosclaves implicados en la conceptualización, planificación e implementación de cual-quier proyecto de digitalización.

La guía de digitalización de la biblioteca digital de Georgia (USA)7 está centrada enla digitalización de documentos históricos, fotografías, etc. Tiene un componentelocal muy importante.

La guía de digitalización del proyecto COINE (Cultural Objects in Networked Environments) de la Unión Europea8. Centrada en aspectos técnicos y con recomen-

286

daciones adicionales sobre la digitalización de material de audio y vídeo que en estedocumento no hemos incluido.

Moving Theory into Practice: Digital Imaging Tutorial9.

LA PLANIFICACIÓN DEL PROYECTO DE DIGITALIZACIÓN

Digitalizar es caro debido a los recursos humanos, técnicos y económicos necesarios,por lo que la digitalización debería ser el último recurso para publicar contenidos en la Red.

Cada proyecto de digitalización tendrá unos motivos concretos para llevarse a cabo. Ennuestro campo de actuación, los servicios de publicaciones de las universidades españo-las, la principal motivación será proporcionar acceso al material impreso agotado. No esrecomendable utilizar de forma indiscriminada la digitalización para colocar en la Reddocumentos que han sido diseñados y producidos para ser distribuidos en formato impre-so. Los gastos necesarios para la digitalización de este material no compensarían losbeneficios obtenidos, a no ser que la audiencia potencial o el interés académico lo justifi-caran. En estos momentos no se justifica editar en formato impreso exclusivamente, sinoque se debe tener en cuenta que cualquier obra puede acabar existiendo en formato digi-tal en el futuro por lo que nos ahorrará tiempo y esfuerzo diseñar los nuevos documentoscon esa posibilidad y en formatos que nos permitan obtener productos impresos o digita-les indistintamente a partir de un documento fuente. Tampoco es recomendable utilizar ladigitalización por motivos de conservación. No es función de los servicios de publicacionesgarantizar la permanencia de los documentos en el tiempo. Esta función la cumplen lasbibliotecas.

No obstante, cualesquiera que sean las motivaciones para llevar a cabo un proyectode digitalización en un servicio de publicaciones, la redacción de un plan debe ser el pri-mer paso a seguir. El tiempo que se gaste en esta etapa se plasmará en una más fácil ges-tión y ejecución del proyecto en el futuro. Según las recomendaciones del proyectoMinerva, en el plan deben ser respondidas al menos las siguientes cuestiones:

¿Qué se va a digitalizar? ¿Quién lo va a hacer? ¿Dónde se va a realizar? ¿Cuándo tendrá lugar? ¿Cómo se va a realizar?

En general, un proyecto de digitalización debería tener claramente especificados losobjetivos que se pretenden alcanzar. Igualmente, se debería recopilar información sobreexperiencias similares llevadas a cabo por otras instituciones, de forma que se puedaaprender de sus aciertos y errores.

El manual del proyecto Minerva hace las siguientes sugerencias: El proyecto debe tener unos objetivos concretos que deben estar documentados. Los objetivos deben ser realistas en relación a los recursos materiales, financieros y humanos disponibles.

Todos los pasos del proyecto deben ser validados para asegurar que el trabajo quese está llevando a cabo contribuye a alcanzar los objetivos.

Se deben especificar los beneficios que se prevé que el proyecto proporcione a la institución.

287

Igual que sucede en otras áreas los recursos humanos son fundamentales para el buenfuncionamiento del proyecto. Antes de que éste comience es importante asegurarse deque estén disponibles los recursos humanos necesarios. Muchas instituciones no cuentancon personal con tiempo disponible para llevar a cabo la digitalización además de sus ta-reas habituales. Se debería dotar con el personal adecuado, con unos conocimientos apro-piados, así como prever un plan de formación para proporcionar una experiencia adicionalen caso de que el proyecto así lo requiera. Se sugiere que:

Se asegure el personal suficiente para llevar a cabo el proyecto de forma satisfacto-ria.

Se asigne un personal determinado a cada tarea que se especifique en el plan delproyecto.

Se identifiquen las necesidades de formación del personal. Se proporcione formación en el uso del hardware y software seleccionados para llevar a cabo el proyecto antes de que éste comience.

EQUIPAMIENTO

Se debe preparar un entorno apropiado para la digitalización. Los elementos de eseentorno incluyen hardware para el proceso de digitalización propiamente dicho, unainfraestructura informática a la cual conectar el hardware, software para la captura y pro-cesamiento de las imágenes, para incluir metadatos y para llevar a cabo el control de cali-dad de los resultados.

El hardware básico serán equipos para la captura de imágenes (cámaras digitales oescáneres para documentos impresos). Si bien es difícil dar indicaciones concretas sobrelos equipos a utilizar dado que el mercado está cambiando constantemente, se sugiere deforma general que:

El hardware apropiado debe estar instalado y probado antes de que el proyecto comience. Se deben hacer las pruebas necesarias con documentos tipo para valo-rar la calidad de los dispositivos de captura de imágenes.

En caso de utilizar un escáner debería ser al menos del tamaño del mayor documento que se vaya a escanear.

La captura de imágenes debería realizarse a una resolución razonable. Si bien esto se traducirá en ficheros muy grandes, se podrían obtener ficheros más pequeños apartir de esta copia master para propósitos como la distribución a través de Internet.Por el contrario, el proceso inverso no sería posible ya que una imagen de alta cali-dad no puede nunca obtenerse a partir de una de poca resolución.

La definición de «resolución razonable» dependerá de la naturaleza del material que se está escaneando y de los usos a los que se va a dedicar. Por ejemplo, si lasimágenes escaneadas se van a utilizar únicamente como miniaturas, esto puedeconseguirse con una baja resolución. Igualmente, la resolución debe capturar losdetalles más significativos del documento. Si el escaneado a una alta resolución noaportase ninguna información adicional que si se hiciera a una resolución menor, laprimera opción es difícil de justificar.

La imagen capturada debería almacenarse en un fichero con formato «sin pérdida», por ejemplo, no comprimido. Normalmente, para las copias master se utiliza un for-mato TIFF (Tagged Image File Format).

Se debería contar con un sistema informático con suficiente capacidad de almace-namiento.

De este sistema deberían hacerse copias de seguridad de forma regular.

288

Una vez que obtenemos la imagen digital del documento, el fichero resultante requeri-rá algún tipo de procesamiento utilizando un software de tratamiento de imágenes antesde poder ser usado. Por ejemplo, un caso frecuente es que el fichero sea demasiado gran-de y se requiera alguna versión comprimida (por ejemplo, una miniatura de una portadapara ser utilizada en una página web). El software seleccionado debe adecuarse a losobjetivos y a la tipología documental que se está tratando. Si bien los equipos de digitali-zación vienen con software incluido, normalmente éste no tiene suficiente potencia ni fle-xibilidad.

El proyecto debe adquirir el más apropiado y potente software que pueda afrontar dadosu presupuesto. La evaluación de diferentes paquetes puede salvar mucho tiempo y tra-bajo a largo plazo. Como un mínimo absoluto, el software elegido debe permitir:

Abrir ficheros de imágenes de gran tamaño. Modificar la resolución y la profundidad de color. Salvar versiones diferentes, con diferentes tamaños de fichero. Seleccionar y copiar una parte de una imagen y guardar ésta como un fichero dife-rente.

Exportar imágenes en diferentes formatos incluidos los estándares del Web: JPEGy GIF.

En el caso de que la digitalización vaya acompañada de un OCR (Optical CharacterRecognition), la elección del software apropiado es crítica. Todo OCR lleva implícita unacierta cantidad de trabajo manual de edición y corrección; la forma en que esto esté sopor-tado por el software puede tener un efecto decisivo sobre el tiempo y el esfuerzo requeri-do por el proyecto. Los mejores paquetes de OCR deben permitir corregir y visualizar enuna sola pantalla, sugerir posibles correcciones para las palabras mal interpretadas, ofre-cer soporte de texto en varias columnas, etc.

SELECCIÓN DE MATERIALES

La selección del material para ser digitalizado es una decisión importante en cualquierproyecto. Los criterios diferirán dependiendo de los objetivos establecidos y estarán limita-dos por factores adicionales, como pueden ser restricciones legales, políticas instituciona-les, dificultad técnica de la digitalización, copias digitales de los documentos ya existentes,etc. Se sugiere establecer criterios para la selección del material y reflejarlos en el plan delproyecto. Al menos los siguientes puntos deben tenerse en cuenta:

Demanda prevista de los documentos digitalizados.Contenido. De una forma u otra la selección del material estará orientada porel contenido. La pregunta que se debe responder sería: ¿el contenido intelectual deeste documento justifica los esfuerzos, costes y recursos que se van a necesitar?Cada institución deberá tener sus propias definiciones de valor basadas en losobjetivos que se pretenden obtener. Durante los últimos años se ha popularizadola creación de bibliotecas digitales o colecciones virtuales. Los servicios de pu-blicaciones pueden crear este tipo de colecciones con los materiales impresos,pero en la actualidad es mucho más rentable planear que cualquier documento a-cabará existiendo en formato electrónico de una forma u otra, por lo tanto, es me-jor tener en cuenta este hecho desde el momento mismo de su creación.

Derechos de copia. Este es un aspecto crucial en la selección. Se debe asegurar

289

que la institución ostenta los derechos de copia de los documentos que se debendigitalizar o alternativamente que tiene el permiso escrito de los autores de losmismos.

Acceso al material que de otra forma no estaría disponible o con disponibilidadlimitada.

Ampliar y facilitar el acceso a un material popular. Coste de la digitalización. Disponibilidad de otras versiones digitales ya existentes. Adecuación de los documentos fuente para su visualización en línea.

Los criterios de selección deberían ser explícitos y discutidos por todas las partesinvolucradas en el proceso.

Los criterios deberán estar completamente documentados, de forma que las razones para digitalizar o no estén claras a lo largo de todo el proceso.

EL ESCANEADO

El escaneado es el proceso a través del cual obtenemos una imagen digital de un do-cumento impreso. Los documentos fuente son transformados en imágenes digitales utili-zando un escáner o una cámara digital. A través del proceso de captura de imagen losdocumentos son leídos o escaneados con una resolución y profundidad de bit predefinida.Los ficheros resultantes, conteniendo los bits por cada píxel, son entonces formateados yenmarcados en una forma que haga fácil para un sistema informático almacenarlos y re-cuperarlos. A partir de esos ficheros el sistema puede reproducir representaciones ana-lógicas para mostrarlas en pantalla o imprimirlas. Dado que los ficheros que contienen imá-genes de alta resolución son muy grandes, puede ser necesario reducir su tamañomediante técnicas de compresión.

Cuando un documento ha sido escaneado, todos los datos son convertidos a un for-mato de fichero particular para ser almacenado. Hay varios formatos de imágenes en elmercado que son ampliamente utilizados.

La calidad de la imagen obtenida en este proceso determinará la calidad final del pro-ducto. De esta forma se recomienda:

Asegurarse de que el soporte de cristal del escáner está completamente limpio entodo momento.

Establecer una convención para nombrar los ficheros obtenidos, por ejemplo, usan-do el sistema de identificación existente o dándoles nombres significativos:

El nombre del fichero debería permitir la asociación entre el fichero y el documentofuente.

Si el documento tiene un identificador o código asignado (por ejemplo un ISBN oISSN) es recomendable utilizarlo.

Utilizar solamente minúsculas. Por compatibilidad con diferentes sistemas se recomienda utilizar un nombre deocho caracteres con una extensión de tres siempre que sea posible.

Si es necesario establecer un sistema nuevo, una buena opción sería utilizar una odos letras seguidas de al menos tres números, de la forma: gr001.tif, gr002.tif, etc.

Es conveniente mantener siempre el mismo número de caracteres en el nombre el fichero y no variar la longitud. Esto hace el procesamiento automático muchomás fácil.

290

Escanear con la mayor resolución y profundidad de bit que sea posible según losobjetivos que se persigan, las limitaciones de los equipos y las condiciones de alma-cenamiento de los datos.

Realizar copias de seguridad del sistema en que se almacenen los datos con unaperiodicidad diaria.

Es importante el control de la calidad de la imagen y de los metadatos.

EL OCR (OPTICAL CHARACTER RECOGNITION)

Los documentos escaneados pueden presentarse al lector en forma de imágenesexclusivamente o bien convertirse en texto como parte del proceso de digitalización. Estose hace a través de un proceso de OCR. El texto resultante podrá ser presentado en unapágina web, almacenado como XML/SGML o incluido en una base de datos, de tal formaque puedan realizarse búsquedas, conversión de formatos o cualquier otro tipo de proce-samiento. Si se decide utilizar OCR se recomienda:

Tener en cuenta que el OCR funciona mejor con documentos que se encuentren enbuenas condiciones físicas y de conservación.

Evaluar múltiples paquetes de software antes de seleccionar un producto en particu-lar. En muchos casos, los programas de OCR están incluidos con el escáner, perosuelen ser de poca calidad. Es mejor buscar paquetes vendidos por separado.

Un software que proporcione una interfaz amigable para llevar a cabo la identifica-ción y corrección manual de errores, ambigüedades y partes del texto que no sehayan podido procesar.

Se debería evaluar la existencia o no de diccionarios del lenguaje en que se encuen-tren los documentos fuente como parte del software de OCR.

Entre los productos disponibles en el mercado, los más relevantes serían: OmniPage,TextBridge y Adobe Capture.

CONTROL DE CALIDAD

El control de calidad es un componente importante de todas y cada una de las etapasde un programa de digitalización. Sin esta actividad es imposible garantizar la integridad yconsistencia de los ficheros de imágenes.

Aunque el control de calidad es un factor crucial para asegurar los mejores resultados,no hay una forma normalizada de asegurar una cierta calidad de imagen en el momentode la captura. Las condiciones para la calidad de las imágenes digitales pueden ser des-critas con tres pasos:

Identificación del producto final esperado y los objetivos de producción. Decidir quéserá producido y evaluado.

Establecimiento de estándares. Definir los niveles de calidad de las imágenes basa-dos tanto en los atributos de los documentos originales como en la capacidad delequipo digitalizador que se esté usando.

Establecimiento de unas pautas de referencia. Decidir con qué se va a comparar elresultado de la digitalización.

Dependiendo de estas decisiones el siguiente paso será determinar qué deberían incluirlos programas de control: el total de la colección o una muestra. En la mayor parte de loscasos es suficiente con establecer un plan de muestreo cubriendo, por ejemplo, el 10% de

291

todas las imágenes producidas por cada escáner durante un cierto período de tiempo (día,semana...). Si en un porcentaje significativo de las imágenes examinadas se han encon-trado errores, entonces la colección completa deberá someterse a examen.

Por otra parte hay que decidir el método de evaluación de las imágenes digitales utili-zando bien la pantalla bien las versiones impresas. En cualquier caso habrá que tener encuenta ciertas limitaciones técnicas que pueden afectar al proceso de evaluación como, porejemplo, disponer de impresoras en color de calidad. Si la evaluación se hace sobre panta-lla se recomienda:

Visualizar las imágenes a una escala de 1:1. Usar valores de referencia para evaluar la reproducción de colores o escala de gri-ses.

Utilizar valores de referencia de resolución e histogramas para evaluar la resoluciónespacial y la reproducción tonal.

En caso de evaluar versiones impresas se recomienda comparar las imágenes impre-sas con los documentos originales para comprobar que se cumplen los objetivos.

METADATOS

Una vez que el fondo de documentos escaneados comience a crecer, se haráimprescindible alguna herramienta de búsqueda y localización de información que nospermita acceder de forma rápida a los contenidos. Para describir las imágenes digitalesson necesarios los metadatos, esto es, datos estructurados sobre los propios datos. Suuso está relacionado de cerca con las reglas para la descripción y catalogación de publi-caciones impresas. La diferencia reside en que en el mundo digital se necesitan catego-rías adicionales de metadatos para soportar la navegación y la gestión de los ficheros.

Los metadatos que describen imágenes digitales pueden contener información dediferentes tipos. La Biblioteca del Congreso de los Estados Unidos identificó tres catego-rías:

Descriptivos: para la descripción e identificación de fuentes de información. Estructurales: para facilitar la navegación entre las distintas partes de un documen-to y la presentación del mismo.

Administrativos: para gestión y proceso.

El nivel de metadatos descriptivos siempre determina el nivel de posibilidades de recu-peración de la información. Es de crucial importancia en el momento de planificar el pro-yecto, decidir hasta qué nivel de profundidad se podrían buscar las imágenes.

Se debe tener en cuenta que la creación e implementación de metadatos son proce-sos que consumen muchos recursos. Habrá que hacer un balance de costes y beneficios,teniendo en consideración las necesidades de los usuarios actuales y futuros. Los reque-rimientos de metadatos deberían estar íntimamente unidos a las funciones que debensoportar: gestión de derechos, preservación a largo plazo, localización de información, etc.

Habrá que considerar los siguientes puntos: El uso de metadatos apropiados es crucial para permitir la búsqueda y recuperaciónde material de una colección digital. Esto es mucho más importante cuando se plan-tean búsquedas en más de una colección.

292

Ya existen múltiples modelos de metadatos. Cada proyecto deberá elegir el más ade-cuado a sus objetivos, evitando en la medida de lo posible crear uno nuevo.

Entre los esquemas de metadatos más utilizados en la actualidad está el DublinCore. Este formato fue creado a finales de los años noventa a partir de una iniciati-va de la OCLC (Online Computer Library Center) y la NCSA (National Center formSupercomputing Applications). Esta iniciativa presentaba un formato compuesto por15 elementos de metadatos descriptivos. Los objetivos de este formato eran ser sim-ple, internacional y que funcionara en varios sectores. El Dublin Core es uno de losestándares de metadatos más ampliamente aceptados en el mundo.

Aunque algunos metadatos son estáticos (fecha de creación, resolución utilizada,etc.) algunos elementos pueden continuar evolucionando y requiriendo actualizacio-nes y mantenimiento.

La creación y gestión de los metadatos puede ser manual (creación de un registroen Dublín Core) y automatizada (generar un índice a partir del resultado del OCR).

Los metadatos pueden ser internos (cabeceras de ficheros TIFF) o externos (índicesy bases de datos asociados). El factor clave para tomar una decisión es evaluar sisu localización soporta la funcionalidad y la gestión de los recursos. Por ejemplo, lascabeceras de los ficheros TIFF contienen metadatos pero estos se perderán si sonconvertidos a otros formatos como JPEG.

PRESENTACIÓN Y PUBLICACIÓN

Hasta este momento se ha creado y almacenado una copia máster de los materiales.Hemos identificado un esquema de metadatos apropiado, y se han creado los metadatosadecuados para cada documento.

La preparación para la publicación implica un cierto procesamiento del material crea-do. Normalmente, por publicación entendemos alguna forma de visualización de los con-tenidos a través de Internet y procesamiento significa reducir el tamaño de los ficheros,ajustar la calidad y elegir los formatos de descarga más apropiados para adaptarse a lascaracterísticas de Internet.

Los ficheros TIFF, creados durante el proceso de escaneado, suelen ser demasiadograndes (varios Mb) lo que los hace inapropiados para su publicación en Internet debidoal elevado tiempo que el usuario final necesitaría para completar una descarga.

Sugerencias prácticas: Crear versiones apropiadas para ser distribuidas en Internet a partir del máster.Como mínimo, debe haber una versión para descargar de Internet.

Las versiones para descarga se crean abriendo los ficheros TIFF en un paquete deprocesamiento de imágenes y exportándolos a formato JPEG, PNG, etc. Aunqueexisten programas gratuitos de tratamiento de imágenes como GIMP, Paint oPaintshop, dado el volumen de documentos que vamos a tratar es convenienteinvertir en productos comerciales como Photoshop, etc.

Normalmente, la profundidad del color puede reducirse a 256 colores, a no ser quese aprecie una pérdida de calidad, lo cual exigirá usar una resolución mayor.

Una imagen creada a 72 ppi se visualizará a aproximadamente su tamaño originalen muchos monitores. Esto hace la resolución de 72 ppi una resolución razonablepara muchas imágenes que han de visualizarse en pantalla.

293

Elegir el formato de los ficheros, la resolución de color y la resolución de píxel impli-ca decidir cuál es una aceptable calidad para las imágenes. Se debe encontrar unbalance entre calidad y tamaño de los ficheros.

En general, el número total de ficheros de imágenes en una página web no debería exceder de los 100 kb. Aunque imágenes mayores puedan publicarse, se sugiereacceder a ellas a través de un enlace en la página, más que incluirlas en la misma.

Muchos proyectos de digitalización llevan a la creación de recursos accesibles enlínea, normalmente a través de páginas web. Van desde los sitios más simples, con pági-nas HTML estáticas, hasta los portales más elaborados acompañados de bases de datos,etc. Existe multitud de documentación sobre la creación y el mantenimiento de páginasweb, por lo que no consideramos oportuno profundizar en el tema en este capítulo.

GESTIÓN

El éxito de cualquier proyecto, incluyendo los de digitalización, está influenciado por lagestión del mismo. Vamos a proporcionar ahora una serie de recomendaciones dirigidas acuatro aspectos fundamentales del proceso: gestión propiamente dicha, recursos huma-nos, externalización de procesos y costes.

Dado que el proyecto de digitalización implicará la digitalización de cientos de docu-mentos, es importante establecer un diagrama de flujos para facilitar el trabajo delequipo.

Establecer y documentar cada uno de los pasos a través de los cuales debe pasarun ítem.

Desarrollar una base de conocimiento que permita rastrear un determinado ítem através de todo el proceso de digitalización, así como permitir revisar el estado delproyecto en cualquier momento. Esta base de conocimiento puede tomar la formade una base de datos, una hoja de cálculo o, simplemente, una colección de docu-mentos e informes. Lo importante no es el formato sino el proceso que asegure elregistro de las acciones que se están llevando a cabo.

El nombre, identificador y otra información relevante de cada documento debería ser introducida en la base de conocimiento desde el mismo momento que ha sido selec-cionado para ser digitalizado.

Establecer un manual de procedimientos. Siempre que sea posible incluir, al menos, una persona con formación adecuada enel área de las nuevas tecnologías de la información.

Determinar, antes de empezar el proyecto y registrarlo en la fase de planificación, losconocimientos que tiene el personal que va a trabajar en el mismo sobre tecnologí-as de la información e indentificar las necesidades de formación.

A veces es apropiado para el proyecto de digitalización contar con los servicios deterceras partes. Los servicios que son externalizados habitualmente incluyen la digi-talización en sí misma, la gestión del proyecto, el desarrollo de software, etc.

Las relaciones con las terceras partes deberían estar claramente reguladas median-te un contrato escrito. Se debería acordar una completa especificación de los servi-cios o productos que han de ser proporcionados antes de que el trabajo comience.

El trabajo desarrollado debería ser revisado regularmente para asegurar que lo que se está suministrando es en realidad lo que el proyecto quiere o necesita.

Si bien la utilización de terceras partes puede ser conveniente, hay que tener en cuenta que toda la experiencia ganada durante la ejecución del trabajo externaliza-do será perdido para nuestra institución al final del proyecto.

294

Además de la externalización de tareas, se puede recurrir a la colaboración con otrasinstituciones similares. Un ejemplo sería la participación en proyectos de investiga-ción financiados por la Unión Europea, donde se podría contar con socios de variospaíses. En este tipo de colaboración, cada socio debería tener un papel claro en elproyecto. Si, en algún caso, el papel no está claro hay que revisar si el socio es deverdad necesario.

Asegurarse de que todos los socios están al corriente y han soportado sus papelesy responsabilidades dentro del proyecto. Refrescar este conocimiento regularmente.

Establecer un modo de comunicación entre todos los socios y asegurarse de que cada uno recibe la información que está destinada a él. El correo electrónico y laslistas de distribución son ideales para este propósito.

DESDE EL ARCHIVO DIGITAL AL SOPORTE DIGITAL

En este apartado vamos a tratar la creación de documentos digitales propiamentedichos, es decir, aquellos que existen en formato digital desde su origen. Un documentodigital puede diferenciarse de uno tradicional, además de por su formato, en al menos tresaspectos10:

Permanencia: los documentos digitales son por principio fluidos, cambiantes y pue-den evolucionar constantemente. Si bien los analógicos también pueden serlo, porejemplo las diferentes ediciones de una obra, en el caso de los digitales no son fija-dos por el medio de difusión. De hecho un documento digital puede no existir nuncaen un formato tangible.

Apariencia: en los documentos tradicionales su importancia se refleja en la aparien-cia física de los mismos. Así, el tamaño y la presentación de un libro lo distinguencomo más importante que un informe técnico fotocopiado. En el caso de los docu-mentos digitales se pueden usar las mismas técnicas y obtener los mismos resulta-dos independientemente de la importancia del documento.

Tamaño: el documento digital no está limitado por cuestiones de espacio.

EL DISEÑO DE LA ESTRUCTURA DEL DOCUMENTO

En general cuando se habla de diseño de documentos se tiene en mente un diseñobasado en la presentación o apariencia final del documento. Una idea que se ve potenciadapor los editores de texto modernos que se basan en WYSIWYG.

El desarrollo de software para la preparación de documentos ha tenido una importan-cia notable en la industria informática ya desde los años sesenta. Todos los sistemas des-arrollados han seguido básicamente dos paradigmas. El primero especifica el documentoen términos de su apariencia esperada cuando sea impreso. Este diseño procede de laidea, acarreada desde el mundo impreso, de que los documentos son fijos y estables, tantosi van a ser visualizados en papel como en una pantalla y de que serán vistos por el mismotipo de dispositivo de visualización por todos los lectores. Una representación de esta ten-dencia son los editores WYSINWYG (what you see is what you get), es decir, lo que se veen la pantalla es exactamente lo que obtendrá el lector si imprime el documento o lo visua-liza en el mismo editor que usó el escritor. El usuario debe centrarse en la apariencia deltexto que está escribiendo, una apariencia que pretenderá ser fija y estable a lo largo de

295

la vida del documento. Cualquier transformación o cambio de formato exigirá enormesesfuerzos para revisar precisamente el formato de presentación.

Con la introducción por parte de IBM del Generalized Markup Language (GML) apare-ció un segundo tipo de representación basada en la estructura lógica de los documentos.Los documentos tienen una estructura jerárquica intrínseca11: los capítulos se componende secciones, las secciones de subsecciones y así sucesivamente hasta llegar a las fra-ses, palabras y letras. Si las secciones de un documento están marcadas de alguna formaentonces será posible operaciones de procesamiento como mostrar solamente los títulosde las secciones, identificar el resumen, etc. Incluso se podrían mover componentes de undocumento de una localización a otra del mismo sin necesidad de reajustar cada uno delos títulos.

Los mecanismos para marcar la estructura de un documento han variado considerable-mente y van desde los más permisivos como LaTeX, a los más estrictos, como SGML.

Los sistemas de documentos estructurados tienen ventajas e inconvenientes. En gene-ral son más robustos porque incrementan la vida del documento y de sus componentes.Además, dado que el marcado sigue una norma y está separado de la aplicación particu-lar que se esté dando al documento, su mantenimiento se mejora y se hace posible la reu-tilización de los componentes en diferentes documentos. En el lado opuesto, su prepara-ción requiere un mayor esfuerzo en su especificación inicial. Por ello es percibida por losautores como más difícil y compleja porque parece contradecir el concepto de manipula-ción directa del documento. No obstante tomando el conjunto de sus ventajas contrarres-ta fuertemente el de sus debilidades, especialmente cuando hay una necesidad de robus-tez, reutilización y exactitud.

Generalmente hay dos papeles implicados en la creación de un documento: especificaciónde su contenido y especificación de su apariencia12. La tarea de especificación del conte-nido debe ser obra del autor, mientras que la de apariencia debe ser la obra de un diseña-dor de estilo. En muchos casos una única persona puede cumplir los dos papeles, peronormalmente se puede ganar eficacia separándolas ya que las técnicas necesarias enambos casos son diferentes.

Se ha definido una gran variedad de representaciones lógicas que intentan establecer unequilibrio entre estructuras complejas y acotadas por un lado, y estructuras simples y noacotadas por otro. Podríamos establecer tres niveles básicos de complejidad. En el puntomás simple estarían sistemas como Microsoft Word donde la apariencia de la estructuradel documento formateado no está directamente reflejada en la codificación interna deldocumento. El documento está definido como una secuencia de trozos de contenido paracada uno de los cuales se define una transformación particular que define su aparienciafísica. En segundo lugar, en sistemas como TeX/LaTeX que utiliza un lenguaje de marcas,se puede especificar una estructura básica y predefinida dependiendo del tipo de docu-mento que tratemos. Finalmente, en último lugar tendríamos SGML donde las representa-ciones jerárquicas han sido llevadas a su punto más complejo.

A continuación vamos a describir de forma somera algunas de las distintas representacio-nes de documentos que existen, separando aquellas que tienen en cuenta la estructura delos documentos de aquellas que no la tienen.

Los editores, a menudo, se plantean la opción entre mantener las cosas simples (ahorrandotiempo y dinero) o hacerlas más ricas (pero más complicadas y caras)13. Los editores que se

296

plantean sólo la creación de documentos impresos tienden a optar por la simplicidad y uti-lizar el formato con el que más a gusto trabajan. Por otro lado, los editores que necesitanpresentar versiones electrónicas e impresas al mismo tiempo, deberían optar por trabajarcon una combinación de SGML o XML más XSLT.

DOCUMENTOS DE TEXTO NO ESTRUCTURADOS

Texto plano. El documento no estructurado más básico es aquel que no tiene abso-lutamente ningún tipo de formato, solo contiene una sucesión de caracteres y enalgunos casos saltos de línea para hacerlo más legible. Todos los procesadores detexto tienen la opción de grabar un documento en texto plano. En algunas ocasiones se habla de texto plano como sinónimo de ASCII lo cual esincorrecto. ASCII es el acrónimo de American Standard Code for InformationInterchange. Se trata de un código para representar en formato digital caracteres(letras, números, etc.). Al texto codificado usando ASCII se le denomina texto ASCII.Por otro lado, texto plano se refiere a texto sin ningún tipo de formato, independien-temente del código utilizado para representarlo. Se debe tener en cuenta que cuan-do alguien se refiere a texto ASCII de lo que realmente está hablando es de textoplano. El uso más frecuente del texto plano es para la documentación de software informá-tico. En general, es una buena opción cuando hay una incertidumbre total sobre lascapacidades tecnológicas disponibles por la audiencia a la que va destinado el docu-mento, ya que cualquier editor o procesador de texto es capaz de abrir un fichero entexto plano. No obstante en estos momentos y a no ser en casos muy extremos, esdifícil justificar la utilización del texto plano como formato de publicación de docu-mentos.Entre los ejemplos de instituciones que utilizan la edición en texto plano podemosseñalar la Internet Engineering Task Force14. Esta organización se encarga de la ela-boración de los estándares que regulan la arquitectura de Internet. Tales estándares,que se publican con el nombre de RFC (Request For Comments), están elaboradosutilizando exclusivamente texto plano con saltos de línea.

HTML. Son las siglas de Hypertext Markup Language. Se trata, por lo tanto, de un len-guaje de marcas utilizado para representar tanto la estructura como la apariencia deun documento. Es el lenguaje utilizado para realizar las páginas web. Lo hemos colocado en el apartado de formatos no estructurados porque sus capaci-dades para representar la estructura son muy limitadas y no pasan de describiraspectos generales como establecer cuál es el título o los párrafos de un documen-to. El principal desarrollo del HTML se ha llevado a cabo en el área de la presenta-ción o visualización de contenidos debido al empuje de la industria, la publicidad y elcomercio electrónico que necesitan de aplicaciones con un impacto visual impor-tante.Los documentos en HTML son documentos en texto plano a los que se les han aña-dido marcas codificadas usando los caracteres < y >. Tales ficheros se pueden crearcon cualquier editor o procesador de texto tal como Bloc de Notas de MS Windows.No obstante, si se plantea la creación de sitios web, es mejor contar con la ayuda depaquetes especializados como FrontPage de Microsoft o Dreamweaver deMacromedia.Existen cuatro tipos de marcado definidos en HTML:

Estructural: describe la estructura del texto. Por ejemplo, <h1>Saludo</h1> indicaa los visualizadores que Saludo debe tratarse como un encabezamiento de primernivel.

297

Presentación: describe la presentación visual del texto sin tener en cuenta suestructura. Por ejemplo, se puede usar <b>Negrita</b> para colocar un texto ennegrita. No obstante, estas marcas están en desuso y se aconseja a los autoresutilizar hojas de estilo CSS (Cascading Style Sheets).

Hipertexto. Dado que HTML es un lenguaje hipertextual, la marca más importantees el enlace entre varios objetos. Un enlace remite a un lector de una parte a otra deun documento o desde un documento a otro disponible en el mismo sistema o en cualquierlocalización de Internet. Por lo tanto un documento en HTML es un hipertexto queno presenta una lectura lineal sino que el lector es libre de seguir el camino quedesee entre las múltiples referencias o posibilidades que le ha abierto el escritor.

Elementos destinados a crear objetos, por ejemplo botones y listas.Si un documento HTML contiene objetos adicionales, por ejemplo imágenes, éstosson almacenados fuera del documento y enlazados utilizando las marcas oportunas.Por lo tanto, un documento HTML consiste del fichero HTML propiamente dicho y,opcionalmente, de una serie de material adicional como referencias, gráficos o docu-mentos multimedia. Todos estos objetos deben estar disponibles cuando el usuarioabra el documento.Del desarrollo del HTML se encarga el World Wide Web Consortium o W3C15. Enparalelo, las empresas fabricantes de navegadores web como Microsoft han añadi-do y modificado características de la norma con objeto de mejorar sus productos.Una breve historia de las especificaciones desarrolladas por el W3C es:

HTML 2.0. Definido por la IETF en 1996 basado en un trabajo de 1994. Estádescrita en la RFC 186616.

HTML 4.0. Hecho público por el W3C en 1997 con una revisión posterior en 1998. HTML 4.01. Publicado a finales de 1999 para fijar errores en la especificaciónanterior17 Es la especificación estable en estos momento y la que debería seguirsepara la elaboración de todo tipo de documentos en HTML.

El seguimiento de estas normas varía considerablemente. Dagfinn Parnas18, des-pués de revisar en su tesis casi dos millones y medio de páginas, llegó a la conclu-sión de que la mayoría de ellas no se ajustaba a la norma del W3C. Igual que suce-de con el lenguaje natural, se pueden crear convenciones al margen de la norma quehacen uso del carácter abierto de la misma.Actualmente, el W3C está trabajando en el desarrollo del XHTML (la versión 1.0 yaestá disponible) que viene a ser una refundición de HTML y XML. XHTML está pen-sado para ser lo suficientemente similar al HTML como para que los desarrolladorespuedan hacer una transición fácil de HTML a XML. La adopción de este nuevo están-dar está impulsada por el interés, tanto comercial como del consumidor, de conteni-dos de herramientas más poderosas que sobrepasen las limitaciones del HTML. Noobstante, su generalización llevará aún cierto tiempo. Para una introducción a estenuevo lenguaje puede consultarse el artículo de Tom Lieb19.En el campo de la edición científica, el HTML no es un lenguaje apropiado por variasrazones: en primer lugar por el escaso control que el diseñador tiene sobre la formaen que el lector visualizará un documento. En esta visualización juegan un papelimportante tanto las características técnicas del equipo donde se visualice el do-cumento (tamaño del monitor, capacidad de resolución, etc.), como del software utili-zado. Existen multitud de visualizadores web que, en mayor o menor medida, acep-tan la especificación W3C así como características adicionales incluidas por estasempresas. Finalmente, la configuración particular de cada visualizadorpuede afectar a tamaños de letras, etc. En muchos casos, los documentos cien-tíficos serán impresos en lugar de ser leídos en pantalla. La calidad de la impresión

298

de un documento HTML es mucho más pobre que en otros formatos como PDF.Existen importantes limitaciones para la inclusión de fórmulas matemáticas o quími-cas si no es con la adición de imágenes.No obstante estas limitaciones, son muchas las editoriales que ofrecen versiones enHTML de los documentos que publican, si bien nunca de forma exclusiva, sino acom-pañadas de versiones en formatos más aptos para ser impresos como el PDF.Así por ejemplo:

HighWire Press20, uno de los grandes editores de revistas de acceso libre ofrecedos alternativas para cada artículo: HTML para visualización en pantalla y PDFpara impresión.

ScienceDirect21, el portal de revistas electrónicas de Elsevier sigue la misma línea. SpringerLink22.

PDF. Ninguno de los formatos de marcas que hemos visto puede proporcionar unarepresentación facsímil de una página impresa, utilizando, por ejemplo, los mismoscolores, fuentes, etc. y no puede incluir gráficos a no ser que sean convertidos enimágenes. En muchos casos esta fidelidad al documento original no es necesaria,las variaciones en fuentes y proporciones son de menor importancia cuando se tratade ofrecer un acceso rápido a los contenidos. No obstante, cuando éste no es elcaso o cuando se quiere ofrecer al lector una versión de calidad del documento paraser impreso, el formato recomendable es el PDF (Portable Document Format)23, 24.PDF es un formato propietario desarrollado por la empresa Adobe Systems pero quese está convirtiendo en un estándar de facto para la industria editorial, no sólo en elámbito científico sino también empresarial. PDF permite presentar una publicaciónsobre pantalla o sobre papel con la misma apariencia y calidad que si fuera realiza-da en una imprenta. Lo que hace este formato es congelar la publicación originalconvirtiéndola en una imagen (que dependiendo de la longitud del documento puedeir desde una a cientos de páginas).PDF viene a solucionar el problema de la portabilidad de los ficheros. En muchoscasos, para porder leer un documento escrito en un determinado procesador de tex-tos, es necesario que el lector disponga del software adecuado. Si no es así puederecurrir a algún tipo de conversión entre formatos que, por definición, implicará algu-na pérdida de información. Un documento escrito en PDF puede ser visualizado encualquier plataforma informática con el único requisito de disponer de un lector queestá disponible gratuitamente en la Red. Además del lector desarrollado por Adobe,llamado Acrobar Reader, existen multitud de lectores creados por terceras partes ydisponibles gratuitamente en Internet. PDF es el sucesor del lenguaje PostScript también desarrollado por la misma empre-sa y muy popular en las áreas científicas y técnicas durante los años ochenta ynoventa. PostScript es un lenguaje de descripción que representa cada página de undocumento incluyendo todos los elementos que aparecen sobre ella, como empla-zamiento de gráficos, fuentes, etc.Dado que se trata de una imagen, su tamaño es mayor y es más lento de descargarque la versión en HTML del mismo documento. Por lo tanto, es recomendable quedocumentos muy grandes se dividan en partes que puedan descargarse por separa-do. Un versión completa puede ser útil también para usuarios con buena conectivi-dad.PDF es un formato muy atractivo para editores particularmente si se utiliza en con-junción con XML. Ahora es posible incluir hipertexto en documentos PDF así comoextraer el texto de los mismos para ser indizado por los motores de búsqueda. No

299

obstante, PDF no es apropiado para todos los mercados y, además, los sistemas uti-lizados por deficientes visuales no trasladan documentos en PDF en sonido.Como ejemplos de editores que actualmente están usando este formato se podríanseñalar los mismos que en el apartado anterior pues generalmente se acompañandos versiones del mismo documento, una en HTML para visualización y otra en PDFpara impresión.

Macromedia Director25 y Flash26. Ambos productos son software de la empresa Macromedia. Están orientados hacia la publicación en web, y soportan gráficos devectores animados. Flash es una herramienta para crear animaciones que consuman poco ancho debanda, presentaciones y otras formas de contenidos dinámicos. Ofrece una interfazde programación para la creación de aplicaciones, interfaces web, etc. MacromediaDirector Shockwave Studio es una herramienta similar en cuanto a su objeto peromucho más poderosa y sofisticada. Está orientada a la creación de aplicaciones deocio en 3D, demostraciones interactivas de productos, aplicaciones de e-learning yotros tipos de contenidos multimedia destinados tanto a la Web como a ser publica-dos en CD o DVD. A diferencia del HTML es esencialmente independiente del visualizador web que seutilice. La mayor parte de los usuarios con versiones actualizadas de sus navegado-res verán versiones idénticas de los documentos. Por el contrario, a diferencia deHTML se trata de un software cerrado y para crear una animación es necesario dis-poner del software distribuido por Macromedia y para ver los documentos se nece-sitan los plug-in adecuados, que sí son distribuidos gratuitamente. Cuando los pro-ductos se distribuyen en CD o DVD el software de visualización va integrado y norequiere mayores requisitos. No obstante en estos casos los requerimientos de hard-ware pueden ser elevados.A la hora de trabajar con animaciones y vídeo hay que actuar con cautela. Es reco-mendable repasar las cuestiones de accesibilidad y usabilidad de las páginas web.En general, aunque ambas posibilidades son posibles y tienen su lugar en la Web,los diseñadores tienden a despreocuparse de cuestiones como navegación o pa-ciencia de los usuarios.Aunque Flash puede ser utilizado para diseñar sitios web completos, esto limitará laaccesibilidad considerablemente por lo que solamente se recomienda para realizaranimaciones allí donde sea estrictamente necesario y nunca como un fin en símismo. Igualmente, los productos desarrollados con Director pueden ser impactan-tes pero sólo funcionarán bien en ordenadores multimedia equipados con tarjetas devídeo y sonido y potentes procesadores. Macromedia mantiene una página27 donde se hace una revisión de las empresas einstituciones que están utilizando sus productos.

RTF. RTF son las siglas de Rich Text Format. Se trata de una especificación28

desarrollada por Microsoft para describir la representación interna de documen-tos. Los ficheros RTF son ficheros de texto con una serie de comandos embebidosque proporcionan a un ordenador información básica sobre fuentes, márgenes, etc. RTF es útil para asegurar que cuando se intercambien documentos entre procesa-dores de texto diferentes permanezca un formato básico. Igualmente se utiliza paracompatibilidad con antiguas versiones de procesadores de texto. Así mismo, en edi-ción científica los documentos en forma manuscrita son a menudo remitidos a loseditores en RTF para asegurar la compatibilidad.

Microsoft Word. Microsoft Word29 es el procesador de texto más popular. Los docu-mentos creados con Word no podrán ser abiertos con otros procesadores de texto,

300

a no ser que se lleve a cabo algún tipo de conversión entre ellos. La utilización deeste formato solamente se justificaría en entornos cerrados, por ejemplo la Intranetde una institución, donde el editor tenga la absoluta seguridad de que todos los lec-tores tienen acceso a este editor y quiera hacer uso de sus facilidades para incluirimágenes, tablas o gráficos. En cualquier otro caso, sobre todo si el medio de distri-bución va a ser Internet, es absolutamente desaconsejable.

Microsoft Reader. Microsoft Reader30 el software de Microsoft destinado a crear ydistribuir libros electrónicos (e-books). Una de las principales desventajas del medioelectrónico frente al papel, que hace que el comercio de e-books no despegue, es ladificultad para leer sobre una superficie luminosa como es el monitor y con una re-solución mucho menor que las páginas impresas. MS Reader es el producto des-arrollado por Microsoft para permitir la lectura sobre pantalla que se acerque a laconveniencia y la calidad del papel. Es el primer producto que incluye tecnologíaClearType, que mejora la resolución sobre pantallas de cristal líquido hasta en un300% para suministrar un producto lo más parecido posible al papel. En cierta forma, MS Reader es un competidor de PDF, con la salvedad que PDF estádiseñado para producir documentos impresos y Reader lo está para leer sobre unapantalla de ordenador. Los documentos PDF son estáticos en el sentido de que nose adaptan a los diferentes equipos de visualización, por ejemplo, al tamaño de lapantalla. Por el contrario, Reader es dinámico, ya que es capaz de construir cadapágina del libro de acuerdo a las preferencias de cada usuario y con el equipo queestá usando.Las herramientas para visualizar y generar documentos en este formato son gratui-tas y pueden ser descargadas de la página web de Microsoft. No obstante, este esel principal inconveniente de MS Reader, el ser un software propietario que solamen-te existe para MS Windows sin que la empresa piense desarrollar versiones paraotros sistemas operativos.Para generar un libro en formato Reader es necesario partir de un documento enHTML que cumpla con las especificaciones de la Open eBook Foundation.Adicionalmente, se requieren las imágenes de la portada del libro. Se puede gene-rar el documento a través de un add-in para MS Word que se puede descargar gra-tuitamente; utilizando el servicio e-Book Express vía Internet (esta aplicación recibeun documento en una amplia variedad de formatos y devuelve el e-book); o bien uti-lizando herramientas profesionales como ReaderWorks Publisher, que permitegenerar automáticamente una tabla de contenidos o índices a partir del documentoHTML, ordenar archivos de capítulos en el orden lógico, etc.Si bien desde nuestro punto de vista no es un formato recomendable por los incon-venientes señalados, se trata de un formato que se está popularizando gracias, enparte, a la fuerza del gigante de la informática. Así editoriales como Random Houseo Mondadori, y el distribuidor Amazon utilizan MS Reader. Microsoft mantiene unalista31 de editoriales que utilizan sus productos.

DOCUMENTOS ESTRUCTURADOS

SGML. Son las siglas de Standard Generalized Markup Language, o, lo que es lo mis-mo, la norma ISO 8879 de 1986 que define un lenguaje de marcas general para deli-mitar los elementos que componen un documento de texto sin describir su aparien-cia. Para ello se separa estructura de presentación y SGML se centra sólo en la pri-mera de forma, que si un documento cambia de un sistema a otro o partes de undocumento son utilizadas en otro, no necesiten ser recodificadas. Utiliza texto plano

301

para representar tanto el contenido como las marcas que lo describen. No tiene nin-gún código propietario, por el contrario cada usuario (o grupo de usuarios) puedecrear cualquier código que necesite.La clave para interpretar los códigos en un documento SGML es la DTD (DocumentType Definition). De hecho, un documento SGML no está completo sin tres partesdistintas: declaración (que da al usuario información del tipo de lenguaje y codifica-ción que se está usando, por ejemplo inglés y ASCII), la DTD (que detalla todos loscódigos y reglas que se pueden utilizar para describir un particular tipo de documen-to) y finalmente la instancia (el texto que va a ser publicado), marcado con los códi-gos descritos en la DTD.Una DTD es una descripción formal de un particular tipo de documento. Especificaqué nombres se van a utilizar para los distintos elementos, en qué situación puedenaplicarse y cómo se relacionan con el resto de elementos. Por ejemplo si queremosque un documento pueda contener listas compuestas de ítems se podría hacer lasiguiente definición:

<!ELEMENT List (Item)+><!ELEMENT Item (#PCDATA)>

Esto define una lista como un elemento compuesto de uno o más ítems y cada ítemse define como un elemento que contiene nada más que texto plano. Así, en el docu-mento SGML se podría especificar lo siguiente:

<List><Item>Chocolat</Item><Item>Music</Item><Item>Surfing</Item></List>

Aunque SGML no debe ser complicado, a menudo lo es dado que definir una nuevaDTD no es tarea fácil. Cuanto más amplia sea la variedad de documentos que vana ser descritos con una DTD mayor será la complejidad de su definición. En estesentido la ISO ha definido en su norma 1208332 una DTD para el marcado de libros.Una DTD puede incluir no sólo descripciones de los elementos sino también defini-ciones, es decir, reglas que determinan cómo usar cada elemento. Así, es posibleespecificar qué elementos se quiere que aparezcan en un contexto pero no en otro.Por ejemplo, el DTD para una revista puede distinguir entre los elementos que el edi-tor quiera distribuir gratuitamente y aquellos para los que se necesitará pagar.A medida que el número y la complejidad de sus publicaciones electrónicas crecen,los editores necesitan alguna forma de organizarlas y gestionarlas. Dadas sus pode-rosas y flexibles capacidades para describir la estructura, así como su capacidadpara capturar y organizar información sobre las publicaciones (metadatos), SGML esuna solución efectiva.Las revistas son candidatas ideales para representarlas en SGML dado que sondocumentos altamente estructurados y repetitivos.Para una lista de instituciones que actualmente están usando SGML puede consul-tarse la compilación que hace CoverPages33.

XML. Son las siglas de Extensible Markup Language. Se trata de un lenguajede marcas diseñado para llevar un paso más adelante todas las características queofrecía el HTML. De hecho, los dos derivan de SGML (Standard Generalized MarkupLanguage) del que hemos hablado anteriormente. El responsable de su desarrolloes el World Wide Web Consortium por lo que se trata de un estándar abierto. La ver-sión actual34 es la tercera edición de la número 1.0 de febrero de 2004.

302

La principal diferencia de XML frente a HTML es que el primero describe la estructu-ra de un documento no su apariencia. La relevancia del XML en la actualidad pro-cede del hecho de que el HTML básico no sería capaz de proporcionar un entornoadecuado para la siguiente generación de edición basada en la red, donde los datostendrán que ser mostrados en un creciente número de entornos y buscados en for-mas más sofisticadas.En cuanto a su relación con SGML podríamos decir que ésta es la lengua madre,que ha sido utilizada para describir miles de tipos de documentos en múltiples cam-pos de la actividad humana, desde la edición electrónica hasta registros clínicos onotaciones musicales. SGML es demasiado grande y compleja lo que hace difícil suimplementación. XML es una versión abreviada de SGML para hacer más fácil a losautores crear tipos de documentos y a los programadores desarrollar aplicacionesque puedan trabajar con ellos. La variedad de documentos XML es muy grande y puede ir desde los más simplescon marcas diseñadas por el propio autor como podría ser:

<?xml version=”1.0” standalone=”yes”?><conversacion>

<saludo>Hola, ¿cómo estas?</saludo><respuesta> Encantado de verte!</respuesta>

</conversacion>

En otros casos pueden ser más complicados con un DTD o esquema asociado quedelimita el vocabulario y elementos a utilizar. Un caso podría ser:

<?xml version=”1.0” encoding=”iso-8859-1”?><!DOCTYPE titlepage SYSTEM “http://www.foo.bar/dtds/typo.dtd” [<!ENTITY % active.links “INCLUDE”>]><titlepage id=”BG12273624”>

<white-space type=”vertical” amount=”36”/><title font=”Baskerville” size=”24/30”alignment=”centered”>Hello, world!</title>

<white-space type=”vertical” amount=”12”/><!— In some copies the following decoration is hand-colored, presumably by the author —>

<image location=”http://www.foo.bar/fleuron.eps” type=”URL” alignment=”centered”/>

<white-space type=”vertical” amount=”24”/><author font=”Baskerville” size=”18/22” style=”italic”>Vitam capias</author>

<white-space type=”vertical” class=”filler”/></titlepage>

No se deben confundir DTD con esquemas XML. Una DTD sirve para describir laestructura de un documento: asigna nombres a los elementos, atributos y entidadesque se pueden utilizar. En principio, están pensadas para ser utilizadas con documen-tos textuales, sin datos tabulados. De esta forma si se necesita especificar rangos denúmeros o definir limitaciones sobre el uso del contenido texto, el DTD no puedehacer nada. Es aquí donde interviene el esquema XML que proporciona la posibili-dad de validar el contenido de los elementos en función de cada tipo de documentoy ofrecer a sus diseñadores criterios para saber si ese contenido es correcto o no.

303

La visualización de un documento XML requiere la existencia de una hoja de estiloasociada. En HTML la forma en que se interpretan las marcas y elementos está pre-definida en los visualizadores web dado que el número de marcas es limitado. EnXML cada autor puede crear sus propios elementos lo que hace que los visualizado-res no puedan prever cómo esos elementos puedan ser utilizados. Los visuali-zadores que admiten XML, probablemente, aceptarán también las hojas de estiloCSS (Cascading Style Sheets). No obstante, también se puede utilizar un lenguajemucho más robusto como es XSLT35 para transformar XML en HTML que ya puedeser entendido por cualquier visualizador.Los prefijos de nombres de espacio distinguen nombres idénticos que estén saca-dos de diferentes vocabularios XML. Una declaración de espacio de nombres en undocumento XML asocia un prefijo de espacio de nombres con un único URI (UniformResource Identifier). El prefijo puede entonces ser utilizado sobre elementos o nom-bres de atributos en el documento. En resumen, no habrá una forma mejor de describir la estructura de los documentosque usando XML. Se trata de una norma internacional, no propietaria, lo cual liberalos documentos de procesos tediosos y costosos de conversión entre sistemas. Norequiere ningún software o hardware especial. Aunque cada vez hay más sistemasbasados en XML es posible crear un documento XML utilizando cualquier editor detexto. Finalmente, libera el documento de las restricciones de cualquier método depresentación, adaptándolo a cualquier forma de visualización, impresa o electrónica,conocida o por descubrir.

TEI. Son las siglas de Text Encoding Initiative36. Inicialmente lanzado en 1987, TEI es un estándar internacional e interdisciplinar destinado a ayudar a bibliotecas,museos, universidades e incluso a investigadores a representar todo tipo de textoscientíficos o literarios, utilizando un sistema de codificación que sea lo más expresi-vo y menos obsolescente posible. TEI fue creado, inicialmente, por tres sociedadescientíficas: Association for Computers and the Humanities, Association for Compu-tational Linguistics y Association for Literary and Linguistic Computing, pero hoy seha convertido en un consorcio internacional compuesto por editoriales, bibliotecas,universidades, etc.Las recomendaciones para la codificación de todo tipo de textos en todo tipo de len-guajes se materializan en una guía titulada Guidelines for Electronic Text Encodingand Interchange37. La primera edición apareció en 1994 y la última, conocida comoP4, en 2002. En estos momentos se está trabajando en una nueva que se anunciaaparecerá en 2004. Esta guía no proporciona sólo un DTD sino también un entornopara la creación de múltiples DTDs adaptados a las necesidades de cada institución.Uno de estos DTDs se conoce como TEI Lite. Este define una selección manejablede todos los elementos que forman TEI. Básicamente, es un conjunto de elementosque cualquiera, trabajando con TEI, debería conocer.El principal objetivo de P4 fue implementar un soporte en XML adecuado al mismotiempo que aseguraba que los documentos producidos con versiones anteriores deTEI permanecieran utilizables con la nueva. Las versiones anteriores se habíanbasado en SGML. Ambos lenguajes tienen en común la definición de textos en tér-minos de elementos y atributos y reglas que rigen su apariencia en el texto. El usode XML en TEI es básicamente el mismo que en cualquier otra aplicación por lo quecualquier software de carácter general capaz de trabajar con XML debería ser capazde procesar los documentos marcados como TEI.El lanzamiento de un versión compatible con XML es un avance considerable quecoloca la iniciativa TEI en la corriente de los más actuales desarrollos de las biblio-

304

tecas digitales y de la World Wide Web. En resumen, la guía define un lenguaje paradescribir como los textos son construidos y propone nombres para sus componen-tes. Hay muchos vocabularios similares en la industria (banca, aeronáutica o mode-los químicos por ejemplo). El logro alcanzado por TEI ha sido exportarlo al mundode los documentos textuales y datos lingüísticos.En la página web del proyecto38 se puede consultar una lista de instituciones queestán trabajando con TEI, así como una serie de tutoriales39 para comenzar a utili-zarlo.

La estructura de edición del Open e-book Forum. El Open e-book Forum40 es una organización internacional dedicada al desarrollo y promoción de la edición electró-nica a través del desarrollo de estándares para sistemas de libros electrónicos de loscuales se beneficiarán los creadores de contenidos, los desarrolladores de siste-mas de lectura digital y los consumidores. En ella participan compañías de softwa-re y hardware, editores, autores, usuarios y organizaciones relacionadas.Un libro electrónico es un documento compuesto de tres partes: publicación o con-tenido digital que se lee; dispositivo de lectura o componente físico utilizado paraacceder al contenido (puede ser un lector de libros electrónicos dedicado, un PC, unasistente personal PDA, etc.); y un sistema de lectura, que es la combinación dehardware y software que procesa la publicación en un dispositivo de lectura determi-nado y la presenta al usuario.Estas especificaciones se materializan en la Open e-book Publication Structure(OEBPS)41. Es una especificación basada en XML para representar el contenido, laestructura y la presentación de los libros electrónicos. En especial está orientada aofrecer a los proveedores de contenidos, autores y distribuidores unas guías míni-mas que aseguren la fidelidad, exactitud, accesibilidad y adecuada presentación delibros electrónicos sobre varias plataformas. El objetivo es definir una norma de des-cripción de contenido para que los productores puedan ofrecer sus productos en unavariedad de sistemas de lectura.Está desarrollada por un grupo de trabajo dentro del Forum. Su primera versión esde 1999 y la actualmente vigente, la número 1.2 es de 2002. Esta versión no cam-bia sustancialmente la primera y se ha asegurado la compatibilidad hacia atrás paraque todos los documentos creados con la anterior continúen cumpliendo la nueva.Entre los cambios más notables están el incremento del número de elementos, la eli-minación de todos aquellos cuyo uso no se recomendaba, la mejora del soporte deCSS, etc.OEBPS está basada en XML por la simplicidad de este lenguaje y porque es previ-sible que los documentos en XML se adapten bien a futuras tecnologías y usos.Además, XML proporciona reglas bien definidas para la sintaxis de los documentos,lo cual reduce el coste de implementación y la incompatibilidad entre sistemas. Porotra parte, XML es extensible, puesto que no está limitado a ningún conjunto parti-cular de elementos de descripción. Otros estándares con los que está relacionado son: CSS (Cascading Style Sheet),Dublin Core y Unicode. CSS42 es un lenguaje de estilos utilizado para definir la apa-riencia con que se presentará al usuario final un documento en formato XML. El cum-plimiento de esta norma no es exhaustivo ya que no están soportadas todas lascaracterísticas de CSS y además se han incluido otras nuevas para limitar los pro-blemas de implementación que pudieran tener los desarrolladores de sistemas delectura. Por su parte Dublin Core es un formato de metadatos para describir recur-sos y documentos electrónicos. Unicode define un conjunto de códigos caracteres

305

para poder representar caracteres en todas las lenguas conocidas y que aparezcanen el futuro.En la página web del Forum puede consultarse una lista de organizaciones partici-pantes entre las que podemos destacar Oxford University Press, Gale Group,Elsevier o Springer-Verlag. Igualmente se puede descargar un ejemplo de libro43

codificado según OEBPS. Se ofrece tanto la fuente en formato XML, como las hojasde estilo para su visualización.

TeX/LaTeX. Es un sistema de composición de textos orientado al mundo científicoque utiliza un sistema de marcado similar en cierta forma a SGML o XML. Cadadocumento en TeX/LaTeX se compone de texto plano acompañado de marcas quedefinen tanto la estructura general del documento como cada uno de los elementosque lo forman. Hay que tener presente que fue diseñado originalmente para trabajarcon documentos impresos y que su adaptación a documentos web o multimedia noes perfecta. TeX fue desarrollado por Donald Knuth en el año 1978, a petición de la AmericanMathematical Society, para poder componer texto y fórmulas matemáticas con lacalidad de los sistemas de fotocomposición de entonces, pero sin el penoso esfuer-zo que esos sistemas requerían. TeX/LaTeX es un sistema abierto del que existen versiones para casi todas las pla-taformas informáticas. Además existen aplicaciones para convertir los documentosfuente en otros formatos como PDF o HTML. Es un lenguaje especialmente apropia-do para el tratamiento de fórmulas matemáticas. TeX/LaTeX cuenta con una gran comunidad de usuarios. Gracias a ello, dispone demucha ayuda y recursos on line, y también de una gran cantidad extensiones paracampos concretos (que van desde la música o la química molecular hasta los circui-tos eléctricos o el ajedrez), o que aportan nuevas funcionalidades (documentos conun número variable de columnas, transparencias, colores...).Un documento TeX/LaTeX se divide en dos partes: el preámbulo y el contenido deldocumento. El preámbulo se define como la parte del documento que va antes delcontenido. Se usa para incluir información sobre la naturaleza del documento, loscomandos que definimos nosotros mismos y para incluir los paquetes opcionalesque queramos usar en nuestros diseño.

\documentclass[a4paper,12pt]{article}\usepackage[latin1]{inputenc}\usepackage[T1]{fontenc}\usepackage[spanish]{babel}\title{Título del texto}\author{Autor del texto}

En este ejemplo hacemos lo siguiente: 1. Se define el tipo de documento (artículo, tipo de letra base de 12 puntos y hojas

A4). 2. Se incorpora el paquete inputenc para que acepte símbolos como letras con tilde,

eñes, ... 3. Se incorpora el paquete fontenc para que se codifiquen los símbolos especiales

con los códigos correspondientes y no con combinaciones de caracteres. 4. Se carga el paquete babel que modifica el comportamiento de TeX/LaTeX para

adaptarlo a idiomas distintos del inglés. 5. Se define el título del documento. 6. Se define el autor del documento.

306

El resto del documento (el contenido junto con las diferentes marcas estructurales)se introducirá dentro del entorno document, en el ejemplo incluimos la orden make-title para que TeX/LaTeX construya una portada de nuestro documento.

\begin{document}\maketitleTexto a continuación...\end{document}

Para escribir textos en TeX/LaTeX solamente se necesita un editor de texto. Ahorabien esos ficheros deben ser compilados para conseguir las versiones utilizables porel usuario (PDF, PostScript, HTML, etc). La compilación se realiza a través de apli-caciones que son gratuitas y que pueden descargarse de Internet. En la página webdel grupo de usuarios de TeX en castellano, CervanTeX44, puede encontrarse másinformación sobre cómo componer textos utilizando este sistema. Además existenalgunos manuales básicos45, 46.

LOS FORMATOS DE IMAGEN

Imágenes estáticas. Los formatos digitales de imágenes se dividen en vectoriales ymapas de bits. El formato vectorial para la Web de preferencia es SVG. Su soportepor parte de los navegadores no es muy amplio todavía. Una imagen digital de mapade bits es una imagen que ha pasado por un proceso de conversión, para que puedaser almacenada en forma de bits en un ordenador. Entre los formatos de imagen deeste tipo más usados están JPG, GIFF y PNG.Existen multitud de formatos en los que presentar un archivo de imagen digital está-tica. Los más conocidos son:

BMP, Microsoft Windows Bitmap file. CUR, Microsoft Windows Cursor file. EPS, Encapsulated PostScript. GIF, CompuServe Graphics Image Format file. HDF, Hierarchical Data Format file. ICO, Microsoft Windows Icon file. JPG, Joint Photographic Experts Group. WMF, Window Meta File. PBM, Portable Bitmap file. PGM, Portable Grayscale Map file. PIC, PIXAR Picture file. PCX, PC Paintbrush. PICT, SoftImage PICT file. PIX, Alias Pixel image file. PNG, Portable Network Graphic. PPM, Portable Pixel Map file. PS, PostScript. RAS, Sun Raster file. RGB, Silicon Graphics RGB image file. RGBa, 4-component Silicon Graphics image file. RGBA, 4-component Silicon Graphics image file with generated alpha. RLA, Wavefront raster image file. RLE, Utah Runlength-encoded image file. RPBM, Raw Portable Bitmap file.

307

RPGM, Raw Portable Grayscale Map file. RPNM, Raw Portable any Map file. RPPM, Raw Portable Pixel Map file. SYNU, Synu Image file. TGA, Truevision Targa Image file. TIFF, Tagged Image File. VIFF, Khoros Visualization Image File Format. X, Stardent AVS X Image file. XBM, X11 Bit Map file. XWD, X Window Dump Image file.

Hay muchos programas gráficos que nos permiten salvar la imagen creada a lamayoría de los formatos relacionados en el cuadro anterior, pero hoy por hoy parainsertar en nuestras páginas web sólo nos resultan útiles cuatro de los anteriores for-matos, ya que los demás no son reconocidos por los navegadores. Estos formatosposibles son: GIF, JPG, BMP y PNG. Vamos a detallar las principales característicasde estos formatos y también del formato TIFF. Los demás nos hemos limitado a rese-ñarlos.

Formato JPEG. Es un formato bastante flexible que fue desarrollado por el JointPhotograph Experts Group al intentar crear un formato para intercambio en la redque soportara gráficos de gran calidad, muchos colores (24 bits de profundidad decolor) y un nivel de compresión elevado y configurable, es decir, utiliza unadistribución de 24 bits/píxel, cada imagen contiene alrededor de 16,777,216colores, el algoritmo de compresión es de tipo «con pérdida». Los archivos de estetipo al ser comprimidos resultan más pequeños que los de tipo GIF. En un principio costó que este formato se abriera camino ya que no estaba muybien valorado por los diseñadores gráficos, sin embargo poco a poco fue siendomás apreciado llegando a ser en la acturalidad el más utilizado. Su sistema decompresión se basa en eliminar de la imagen aquellos colores que el ojo humanono puede distinguir y en agrupar gamas de colores similares. A mayor nivel decompresión, menor calidad en la imagen resultante. Se trata de encontrar un equi-librio entre el peso del archivo y la calidad de la imagen resultante. Entre sus ven-tajas podemos destacar:

Su sistema de compresión es complejo y graduable, lo que permite una ampliagama de compresiones diferentes para una misma imagen. El tamaño de la ima-gen no depende del número de colores que contenga sino de su nivel de com-presión.

Maneja 16 millones de colores. Permite crear imágenes progresivas. Un JPG progresivo es la equivalencia eneste formato de los GIFs entrelazados, permite dividir una imagen en franjas deforma que ésta va apareciendo ante los ojos conforme aumenta la definición dela pantalla, y el usuario la va viendo poco a poco, sin tener que esperar a que secargue completa en la memoria.

Entre sus defectos destacan: Aunque permite grandes niveles de compresión, si la imagen es de gran resolu-ción, el fichero sigue teniendo mucho peso.

No permite la creación de imágenes de fondo transparente ni imágenes anima-das.

Con pocos colores y gradaciones da archivos más pesados que el formato GIF,sin mejora apreciable de la calidad.

308

Formato GIF (Graphic Interchange Format). Formato creado por CompuServe en1987 (su primera versión) aunque la patente del mismo pertenece a la empresaUnisys. En 1989, CompuServe amplió las propiedades de este formato para quese pudieran crear con él imágenes animadas, transparencias e imágenesentrelazadas, dando lugar a la segunda versión de este estándar, conocida comogif 89a. Usa un sistema de compresión LZW modificado. Los ficheros gráficos GIF son los más comunes en las páginas web, debido sobretodo a su facilidad de construcción y a su poco peso, además de ser soportadospor todos los navegadores. Con este formato, cuantos menos colores tenga la imagen y más extensión totalocupe cada uno de ellos dentro de la misma, mejor compresión obtendremos.Dentro de sus ventajas debemos destacar:

Con este formato se pueden crear gráficos de fondo transparente. Se puede guardar una imagen asociándola con su propia paleta de colores. Deesta forma disminuye el tiempo de carga y las imágenes son más compatiblescon sistemas operativos y navegadores.

Podemos construir imágenes animadas, creando un gráfico formado por variasescenas que se unen y forman una secuencia con un tiempo establecido entreuna imagen y otra, como en una película.

Permite construir imágenes entrelazadas, tal como hemos descrito en el forma-to JPG.

Entre sus desventajas debemos destacar: Sólo nos permite trabajar con 256 colores. Debido a esta limitación en los colores, no es adecuado para representar esce-nas con muchos colores ni con una gradación entre estos, como es el caso deuna fotografía. En estos casos es mejor usar otro tipo de formato, como el JPG.

Formato PNG (Portable Network Graphic). Es uno de los últimos formatos decompresión que aparecen en la escena web, exactamente en 1994. Conjuga lomejor de los formatos que habitualmente se han venido utilizado, que son GIF(Graphics Interchange Format) y JPG (Joint Photographer’s Experts Group). Conél se ha pretendido obtener un sistema de compresión como el que usa el formatoGIF pero de código libre. Es el formato oficial de la suite Microsoft Office. Combinala posibilidad de asociar a un fichero gráfico una paleta de color, ventaja que seobtenía con el formato GIF a la vez que permite utilizar millones de colores (colorreal), ventaja que se obtenía con JPG. El formato de compresión que utiliza es dealta calidad, lo que permite reducir los tiempos de descarga. El sistema decreación de imágenes entrelazadas que utiliza es más óptimo que con GIF porquelas procesa con mayor velocidad. El efecto de transparencia fondo/figura es mejor,ya que no se basa en un color de fondo (caso del GIF) sino en la máscara creadapor alguno de los canales alfa que hayamos seleccionado desde Photoshop. PNGes el mejor formato a utilizar cuando trabajamos con imágenes transparentes y enlos casos en que queramos introducir capas en un documento web.Sus principales desventajas son que no soporta las imágenes animadas y que suuso no está aún muy extendido, aunque los principales programas gráficos permi-ten trabajar con él.

Formato BMP. Desarrollado e impulsado por Microsoft, BMP es una abreviatura deWindows BitMaP (Mapa de Bits de Windows), y en realidad una imagen en esteformato es la sucesión de puntos coloreados guardados cada uno independientemente.Al ser un formato gráfico propiedad de Microsoft sólo el navegador InternetExplorer lo soporta. Nestcape no soporta el tipo MIME BMP en ninguna de sus

309

versiones. Entre sus ventajas está el ser un formato extremadamente simple, yentre sus desventajas el ser sólo compatible con Internet Explorer y el gran pesode los ficheros de este formato.Formato TIFF. Tagged Image File Format es un formato que permite el almacena-miento e intercambio de informaciones gráficas provenientes de escáneres, framegrabbers y de programas de retoque y edición de fotos. Puede ser utilizado en variasplataformas como PC (IBM), o Macintosh y estaciones de trabajo UNIX. Sus principales ventajas son:

Su estructura es conocida por una amplia variedad de aplicaciones. Es independiente de sistemas operativos y plataformas gráficas. Los archivos con este formato se pueden ajustar a las características de un escá-ner, monitor o impresora.

Una de sus principales desventajas es que un usuario puede indicar nuevos atri-butos (tags) en una imagen, imposibilitando la interpretación correcta de los datospor otro sistema de lectura de imágenes.La estructura de un archivo de formato TIFF se define por una secuencia de 8 bits(1 byte), donde los bytes son numerados de 0 a N. Este archivo puede alcanzar232 bytes de extensión.

En conclusión, los principales formatos de imagen comprimida son: GIF (GraphicsInterchange Format), recomendable para archivos de imágenes con pocos colorescomo logotipos, dibujos, etc.; JPG o JPEG (Joint Photographic Experts Group), reco-mendable para fotografías, texturas, etc.; TIF; y TIFF comprimidos.Ya que la compresión de imágenes reduce su calidad se recomienda guardar unacopia de la imagen en formato de mayor calidad (TIF sin comprimir) antes de utilizarformatos GIF o JPG. Los archivos gráficos en formato TIFF conservan muy bien losdetalles de la imagen pero son enormemente voluminosos (otro tanto se puede decirdel formato BMP). Los archivos en formato JPG (o JPEG), en cambio, ocupanmenos espacio a cambio de perder un poco de definición que se aprecia esencial-mente cuando ampliamos la imagen. El grado de compresión de un JPG puede ser variable: cuanta más compresión elarchivo resultante será más pequeño a costa de perder detalles y calidad.

Imágenes dinámicas. Un archivo de vídeo es una mezcla de formato de imagen vectorial e imagen de mapa de bits.Dentro de los formatos que sirven para crear imágenes dinámicas o vídeo nos cen-traremos en tres: MOV, AVI y MPEG.

Formato MOV (Macintosh QuickTime .mov, .qt). QuickTime es un formato dearchivo desarrollado por Apple Computer para crear, modificar, publicar y verarchivos multimedia. QuickTime admite vídeo, animación, gráficos, 3D y realidadvirtual (VR).

Formato AVI (PC). El formato AVI es el nativo de Windows (el formato MOV es el nativo de Macintosh). Un vídeo será estándar, entendiendo por estándar que sereproducirá en cualquier ordenador con sistema operativo Windows (o capaz deleer archivos AVI), siempre y cuando no apliquemos ninguna compresión al vídeo.Con el vídeo en formato AVI sin comprimir sucede lo mismo que con los archivosBMP: ocupa demasiado, casi 30 GB para una hora a un tamaño de pantalla(resolución) de 352x288, el usado para el VCD, VHS y/o Video-8. Por tanto, lonormal es que, a excepción de en la captura, se le aplique una compresión alvídeo AVI. Hay una infinidad de formatos de compresión. A estos compresores seles conoce como codificadores de vídeo. Su gran variedad supone un problema

310

porque para poder reproducir un vídeo comprimido con un codificador concreto esnecesario tenerlo instalado en el sistema. AVI significa Audio Video Interleave o Audio y Vídeo Intercalado lo que significaque en un fichero AVI los datos de audio y vídeo son almacenados consecutiva-mente en capas (un segmento de datos de vídeo es seguido inmediatamente porotro de audio). Es el formato más extendido para el manejo de datos deaudio/vídeo en un PC. Los archivos AVI son un caso especial de archivos RIFF (Resource InterchangeFile Format o Formato de Archivos para el Intercambio de Recursos) un formato depropósito general para el intercambio de datos multimedia que fue definido porMicrosoft e IBM tiempo atrás.Sólo existen dos tipos generales de AVI: los basados en Video for Windows (losprimeros en aparecer) y los basados en DirectShow (originalmente ActiveMovie).Los formatos de AVI basados en Video for Windows son los que ahora forman elnúcleo de los denominados AVI DV Tipo-2, mientras que los basados enDirectShow (y por extensión en DirectX) son los denominados AVI DV tipo-1.Formato MPEG. Un vídeo no es más que una sucesión de imágenes en movimien-to. Si comprimimos todas esas imágenes (las de un vídeo) en formato JPEGobtendríamos el formato MJPEG, o Motion JPG. Con este formato ya se logra unabuena compresión con respecto al original. Partiendo del MJPEG se llegó alformato MPEG (Moving Picture Experts Group o Grupo de Expertos de Imágenesen Movimiento) La compresión MPEG supone un avance importante con respectola compresión MJPEG al incluir un análisis de cambios entre una imagen clave, ocuadro clave, y un número determinado (suele ser 14) de imágenes posteriores.Los principales estándares de MPEG son:

MPEG-1. Este estándar se diseñó para permitir la codificación de vídeo progre-sivo a una velocidad de transmisión de aproximadamente 1,5 millones de bits porsegundo (bps). Se diseñó específicamente para medios de vídeo CD y CD-i. Lasimplementaciones más comunes del estándar MPEG-1 proporcionan una resolu-ción de vídeo de 352x240 a 30 imágenes por segundo (fps). Cuando utiliza esteestándar, obtiene una calidad de vídeo ligeramente inferior a la de los vídeosVCR convencionales.

MPEG-4. Se trata del estándar MPEG más reciente que deberá ser aprobado porla Organización Internacional de Normalización (ISO). Microsoft ha creado la pri-mera implementación de este estándar para tecnologías de Windows Media enEstados Unidos con la publicación de la versión 3 del codificador de vídeoMicrosoft MPEG-4. Este estándar fue desarrollado específicamente para la codi-ficación eficaz de contenido multimedia con diversas velocidades de bits, queincluyen desde velocidades lentas en Internet hasta velocidades de reproducciónde imagen completa con calidad de televisión. El codificador de vídeo MPEG-4admite intrínsecamente la transmisión de multimedia ya que permite que existanvarias secuencias en una sola secuencia de datos codificada. Este estándar tam-bién dispone de un algoritmo avanzado de estimación del movimiento que ofre-ce mayor compresión.

DOCUMENTOS MULTILINGÜES

Los documentos intercambiados en el medio de Internet muchas veces precisan seruna mezcla multilingüe, es decir, deben ser presentados utilizando más de un lengua-je en un mismo párrafo, página o documento. Un ejemplo típico es una lista de partici-

311

pantes de un encuentro o reunión en línea, donde cada participante debe ser mencio-nado en su lenguaje/código.

La mayoría de los navegadores de hoy día tienen soporte «multilingüe». Se accede asus funciones «multilingües» al seleccionar un lenguaje adecuado en el menú. Poresto, deberían ser denominadas de multi-localización más que multilingües, ya que nopueden presentar adecuadamente un documento que contenga partes de lenguajesdiferentes en una misma página o en el mismo documento. Para salvarlo se ha de uti-lizar una codificación de caracteres determinada en nuestro documento.

Una codificación de caracteres es un código que empareja un conjunto de caracteresde un lenguaje natural determinado con un conjunto de números o impulsos eléctricos.Ejemplos típicos incluyen el código Morse que codifica las letras como impulsos eléc-tricos cortos o largos o el código ASCII47que codifica las letras, números y otros carac-teres como números enteros o su representación binaria en 7 bits. ASCII se utilizadesde los primeros días de la informática ya que fue normalizado por la AmericanStandards Association (luego ANSI) en 1963. Con 7 bits el sistema es capaz de codifi-car hasta 127 caracteres, que solamente es suficiente para la lengua inglesa.

Esta limitación se intentó solucionar con el desarrollo de la norma ISO/IEC 8859 queutiliza una codificación de 8 bits. Esta norma tiene en la actualidad 15 partes numera-das correlativamente: 8859-1, 8859-2... cada una de las cuales describe caracteres deuna lengua o de un grupo de lenguas. Así, por ejemplo 8859-1, también llamada Latín-1 permite describir todos los caracteres de las lenguas de la Unión Europea. Otras par-tes son por ejemplo, 8859-7 para el griego, 8859-8 para el hebreo o 8859-16 para laslenguas del sureste de Europa (croata, albanés, húngaro, etc.).

El principal inconveniente de esta norma es que cada parte es independiente, lo quehace imposible utilizar en un mismo fichero o documento caracteres procedentes devarias lenguas, por ejemplo mezclar griego con español. Un paso más en la codifica-ción se dio con la aparición de Unicode que utiliza una codificación de 16 bits y permi-te representar más de 100.000 caracteres. Los primeros 128 caracteres son idénticosa ASCII y los 256 restantes lo son a ISO 8859-1. La primera versión de esta norma lapublicó el Unicode Consortium48 en 1991. La última es la número 4.0.1 de 200349. LaOrganización Internacional de Normalización ha desarrollado la norma ISO 10646 quedefine un repertorio de caracteres idéntico a Unicode.

Su objetivo es permitir la representación de cualquier caracter utilizado por cualquierpersona en cualquier parte del mundo y utilizando cualquier lengua. En la actualidadse ha convertido en el sistema de codificación más utilizado y está soportado por losprincipales sistemas operativos como todas las versiones de Windows NT y sucesores,Linux, BSD, etc. No obstante no está exenta de críticas principalmente procedentes deJapón y otras lenguas orientales alegando problemas técnicos y políticos derivados delhecho de que los principales impulsores de la norma son empresas estadounidensescomo Microsoft. De hecho existe en estos países iniciativas para crear alternativas aUnicode, entre ellas UTF-200050 o Giga Character Set51.

En resumen, Unicode proporciona un código numérico para cada caracter de cualquierlengua, el cómo esos números son almacenados en los sistemas de tratamiento de tex-tos es otro problema. Los problemas resultan del hecho de que la mayor parte del soft-ware utilizado fue escrito para tratar con códigos de 8 bits y el soporte para 16 bits seha ido incluyendo progresivamente en los últimos años.

312

La conversión entre números Unicode y bits se realizan a través de un sistema llama-do UTF (Unicode Transformation Format) del que existen las siguientes variantes: UTF-32, UTF-16 y UTF-8.

UTF-8 es una codificación de Unicode en 8 bits. Los primeros 128 códigos son idénti-cos a ASCII con lo cual son sistemas compatibles. Por otro lado UTF-8 es incompati-ble con ISO 8859-1 después del código 127. UTF-16 por su parte utiliza 16 bits. Escompatible hacia atrás tanto con ASCII como con ISO 8859-1. Además puede añadirhasta un millón de caracteres utilizando un mecanismo conocido como pares sustitu-tos (dos unidades de 16 bits por cada carácter).

EL DISEÑO DE LA PRESENTACIÓN

A lo largo de la exposición venimos haciendo hincapié en la distinción entre contenidosde un documento y presentación de los mismos. Hemos visto formatos de documentoscomo XML o SGML que se centraban en describir la estructura de los documentos dejan-do la presentación para otras aplicaciones. En esta sección tratamos precisamente las for-mas de presentación de la información. En el primer apartado describimos las hojas deestilo utilizadas tanto para visualizar en la Web documentos XML como para definir la apa-riencia de los documentos HTML. En segundo lugar hacemos un repaso a las principalesformas de organización de la información en un sitio web y terminamos con una serie derecomendaciones sobre la utilización de buscadores.

HOJAS DE ESTILO

Las hojas de estilo sirven para controlar la apariencia de los documentos web tanto sise utiliza HTML como XML. Nielsen52 hace una serie de recomendaciones generalessobre la utilización de hojas de estilo:

Utilizar una única hoja de estilo para todas las páginas (o un conjunto coordinado dehojas si se trata de páginas con necesidades muy diferentes). Una de las principa-les ventajas de las hojas es asegurar la continuidad visual a medida que el usuarionavega por el sitio web.

Utilizar siempre hojas de estilo enlazadas con los documentos y nunca embebidasen los mismos. Así, sólo será necesario mantener un único fichero y se aligeraránlas páginas de información redundante que solamente ralentizarán su descarga. Noobstante, se debe permitir a los autores incluir estilos adicionales embebidos en laspáginas cuando sea necesario.

Para cada sitio es conveniente que todas las hojas de estilo las diseñe la misma per-sona o grupo de diseñadores. Esto se debe a dos razones, el trabajo centralizado esla única forma de asegurar un diseño consistente para todo el sitio, y, además, el cre-ador de contenidos no siempre tiene que ser un buen creador de hojas de estilo.

Las páginas deben continuar funcionando cuando las hojas de estilo estén deshabi-litadas.

En cuanto a la implementación de hojas: No se deben usar más de dos fuentes diferentes en cada página. No usar tamaños de fuentes absolutos.Si se utilizan múltiples hojas habrá que asegurar que se asignan los mismosnombres a los mismos conceptos en todas ellas.

313

A continuación detallamos dos tipos de hojas de estilo, CSS (Cascading Style Sheets)y XSLT (Extensible Stylesheet Language Transformations) aplicables a documentosHTML y XML, respectivamente.

CSS es una recomendación53 del W3C. Existen dos versiones de esta norma: CSS1apareció en 1996 y actualmente está soportada en prácticamente todos los visualiza-dores web como Internet Explorer, Netscape u Opera. CSS2 apareció en 1998 paraampliar las funcionalidades de la primera. No obstante, los requerimientos que estable-cía eran tan altos que su implementación fue prácticamente nula. Para intentar solucio-narlo en 2003 se hizo una revisión que quitó todos los aspectos de alto nivel que nuncaiban a ser implementados por los navegadores.

En la práctica, CSS se materializa en un fichero de texto que debe tener la extensión.css y que debe estar escrito siguiendo la especificación CSS. Un ejemplo sencillosería:

BODY{ font-family: Verdana, “Minion Web”, Helvetica, sans-serif; font-size: 1em; text-align: justify}H1{ font-family: Verdana, sans-serif; font-size: 1.3em }

En él se define la apariencia de los elementos <body> y <h1> de un documento HTML.Por cada elemento se especifica la fuente que se va a utilizar, su tamaño y la alinea-ción del texto.

Además de cómo ficheros .css independientes, el estilo se puede embeber en cadadocumento particular dentro del elemento <head> de HTML.

En los recursos mencionados sobre CSS que están disponibles en las páginas delW3C, se puede consultar un manual muy completo y con numerosos ejemplos elabo-rado por la consultora Westciv54.

XSLT, por su parte, también es una recomendación del W3C aprobada en 199955. Suobjeto es distinto de CSS en el sentido de que está pensada para transformar un docu-mento XML en otro con formato HTML o en cualquier otro formato que use texto plano.Por lo tanto, más que una hoja de estilo, XSLT es un verdadero lenguaje de programa-ción mucho más robusto que CSS pero también mucho más complicado. Dependiendode las necesidades se elegirá uno u otro. Si únicamente se necesita añadir elementosde estilo a un documento HTML, la opción CSS será suficiente. Si estamos trabajandocon XML entonces deberemos emplear XSLT.

¿Cómo funciona XSLT? Supongamos que disponemos de un documento XML sencillodel tipo:

<source><title>XSLT</title><author>John Smith</author></source>

a través de una hoja de estilo XSLT como la siguiente:

<xsl:stylesheet version = ‘1.0’

314

xmlns:xsl=’http://www.w3.org/1999/XSL/Transform’><xsl:template match=”/”> <h2> <xsl:value-of select=”//author”/> </h2> <h1> <xsl:value-of select=”//title”/> </h1> </xsl:template></xsl:stylesheet>

podríamos convertirlo en el siguiente documento HTML:

<h2>John Smith</h2><h1>XSL</h1>

Una breve descripción del contenido de la hoja de estilo sería:

La primera instrucción es obligatoria e indica la versión y el espacio de nombres deXML que estamos usando.

A continuación, el elemento match nos indica qué parte del documento XML fuentevamos a procesar. En este caso se indica la raíz del documento con /, por lo que seprocesa en su totalidad, pero podríamos haber procesado sólo determinados ele-mentos.

Por cada elemento que encuentre en el documento fuente, si se trata de un authorlo pondrá entre las etiquetas <h2></h2> en el documento HTML resultante. Si setrata de un title lo pondrá entre <h1></h1>.

Para más información sobre XSLT se pueden consultar dos manuales básicos deMichael Kay56 y Sal Mangano57. Por otro lado, el W3C mantiene una recopilaciónexhaustiva de recursos accesibles en línea58 sobre el tema.

TIPOS DE VISUALIZACIÓN

El potencial expresivo que permiten los enlaces en un hipertexto es peligroso. La teo-ría hipertextual se ha dedicado, en gran medida, a establecer modelos conceptualesde las posibilidades de orientación del usuario en función, entre otros aspectos, de laestructura de los enlaces. La tecnología web, con todas sus limitaciones, no permiteelaborar estructuras demasiado complicadas. A continuación se detallan las cuatroestructuras básicas más habituales en el diseño de páginas web59:

Secuencial. La manera más simple de organizar la información es colocarla secuen-cialmente. La ordenación puede ser cronológica, alfabética, temática, etc. Las se-cuencias son la forma más apropiada de organización en documentos didácticos ode formación, donde el lector ha de conocer por fuerza una serie de datos antes deavanzar en la lectura. Otros sitios web más complejos pueden estar organizadossecuencialmente también, de manera que cada página de la secuencia principalpuede contener enlaces a páginas de explicaciones, información parentética (sus-ceptible de ir entre paréntesis, como este comentario) o información sobre otroswebs.

315

Rejillas. Las rejillas son una buena forma de correlacionar variables. Por ejemplo, una rejilla puede estructurarse según la relación que existe entre una línea de evo-lución temporal (siglos, años, etc.) por un lado y un conjunto de información históri-ca clasificada por temas (arte, cultura, hechos históricos, etc.) por el otro. Para queuna rejilla sea efectiva las unidades básicas de información deben compartir unaestructura de temas y subtemas muy uniforme y los lectores han de comprender lanaturaleza de la estructura general y el significado de las variables correlacionadas.Si no sucede así, se perderán fácilmente. Por ello, esta estructura es adecuadasobre todo para público experto, con conocimientos del tema objeto del documentoy su articulación lógica. Los mapas conceptuales pueden ser muy útiles para facili-tar la orientación al lector si se utiliza esta estructura.

Jerarquías. Las jerarquías son la mejor forma de organizar corpus complejos deinformación. Dado que los sitios web están organizados, habitualmente, en torno auna única página principal, los esquemas jerárquicos son adecuados para este tipode documentos; son fáciles de entender y muy habituales en todos los aspectos dela vida por lo que los usuarios están acostumbrados a trabajar con ellos. Una orga-nización jerárquica impone también una disciplina útil en la aproximación analíticadel diseñador de contenidos, ya que las jerarquías sólo son útiles sobre material muybien organizado.

Mallas. La estructura en malla impone muy pocas restricciones. El objetivo es imitar el pensamiento asociativo y el flujo libre de ideas. Así, los lectores pueden seguir suspropios intereses. Irónicamente, los esquemas de organización asociativos son amenudo la estructura más impracticable para un sitio web, porque suelen ser difíci-les de entender y de predecir. No obstante, son útiles para webs pequeños que esténcompuestas fundamentalmente por listas de enlaces, o bien para sitios dirigidos ausuarios muy expertos en el tema, que necesiten una información muy avanzada ocomplementaria y no una mera presentación de los aspectos básicos.

Además de la organización del sitio es de vital importancia disponer de un sistema denavegación apropiado. El web es, básicamente, un sistema de navegación. La interac-ción del usuario consiste en hacer clic en los vínculos de hipertexto para moverse porun amplio espacio de información. Dado que ese espacio es tan grande, la navegaciónse hace difícil y es necesario ofrecer algún tipo de soporte. Las interfaces de navega-ción han de ayudar al usuario a responder a tres preguntas fundamentales:

¿Dónde estoy? La ubicación del usuario se ha de mostrar respecto de la Web comoun todo, para lo cual es necesario que en todas las páginas se identifique el sitio enel que nos encontramos (a través de logos, etc.). Y también en relación a la estruc-tura del propio sitio web. La ubicación relativa se suele dar mostrando esquemas delsitio donde está resaltado el lugar donde se encuentra el usuario. También es impor-tante tener un título claro en la página que se ha de utilizar para darle un nombre sig-nificativo, de forma que los usuarios puedan localizarlas fácilmente en su lista demarcadores.

¿Dónde he estado? Dada la tecnología web actual esta pregunta es difícil de respon-der si no es acudiendo a la utilización de cookies o alguna otra medida de control.Afortunadamente los mecanismos de desplazamiento de los navegadores sirvenpara aclarar dudas al respecto. Además disponen de un historial donde se incluyeuna lista de las páginas visitadas recientemente.

¿Dónde puedo ir? A esta pregunta responden las opciones de navegación y todos los demás vínculos que puede haber en la página. En una página se pueden utilizardos tipos de vínculos:

316

Los asociativos constituyen el texto subrayado normal que indica que hay máscosas sobre un tema que se menciona en el cuerpo del texto. En particular sepueden utilizar para dar al usuario pistas de «véase además» sobre páginas queles puedan interesar también por estar relacionadas con la página actual.

Los estructurales son vínculos que señalan sistemáticamente otros lugares de laestructura del sitio, además de los iguales o secundarios dentro de una jerarquía.Es importante tener los mismos vínculos estructurales en todas las páginas deforma que el usuario entienda qué opciones de navegación estructural puedeesperar.

USO DE BUSCADORES

Una forma adicional de ayudar a localizar información en un sitio web es la utilizaciónde algún tipo de motor de búsqueda. Los usuarios acceden al sistema de búsquedasentrando una o más palabras clave en un formulario. El motor de búsqueda entoncesselecciona y muestra las páginas que contienen dichas palabras.

La opción de búsqueda debería proporcionarse sólo allí donde sea útil. Lo será ensitios muy ricos en contenidos y ofrecerá poco valor añadido en el resto. Los diseña-dores de páginas deberían usar esta opción con cautela. Un motor de búsqueda nuncapuede ser un sustituto de una buena organización de los contenidos y no siempremejoran la efectividad de la búsqueda por parte de los usuarios. Antes de incluir un sis-tema de este tipo se deberían evaluar detenidamente sus ventajas e inconvenientes.

Si se decide ir adelante con un buscador, cada página del sitio debería contener un for-mulario de búsqueda. Normalmente un formulario básico es suficiente para llevar acabo búsquedas sencillas. Si se requieren búsquedas más complejas, es convenienteproporcionar una búsqueda avanzada en una página específica. Cuando existan variasposibilidades de búsqueda habrá que advertírselo al usuario.

Cuando múltiples usuarios tienden a ejecutar búsquedas similares suele ser útil ofre-cer patrones de búsqueda.

Los formularios deberían ser fáciles de utilizar. Es un hecho demostrado que muchosusuarios tienden a usar estrategias de búsqueda simples, empleando muy pocas pala-bras. Sólo excepcionalmente utilizan operadores boleanos, truncamientos u operado-res de proximidad. Es conveniente proporcionar unas instrucciones simples y ejemplosque sirvan de guía.

Es fundamental que el motor de búsqueda no haga distinciones entre mayúsculas yminúsculas. En caso contrario habrá que advertirlo claramente.

El sistema debe buscar en todo el sitio y, si no es este el caso, advertir claramente enqué partes son las que se está buscando. Esto no siempre es fácil, puesto que lo queun diseñador entiende por «todo el sitio» no tiene que coincidir necesariamente con loque considera el usuario.

Por ejemplo, muchos sitios grandes tienen diferentes secciones, cada una mantenidapor diseñadores distintos, por lo que el usuario puede interpretar que solamente hay unsitio cuando un diseñador puede interpretar que hay muchos.

317

Habrá que asegurar que los resultados de la búsqueda proporcionen la informaciónprecisa que los usuarios necesitan. Cuando esto no sucede así los usuarios quedanconfundidos y frustrados.

LA ADICIÓN DE VALOR: METADATOS

A medida que la colección de documentos electrónicos crece se hace necesario man-tener un catálogo con sus descripciones bibliográficas que permita tanto al serviciocomo a los usuarios externos hacer consultas sobre el fondo. Utilizar algún sistema demetadatos permitirá mantener esos datos en un formato normalizado para poder inter-cambiarlos con terceras partes, como por ejemplo, otras editoriales o motores de bús-queda en Internet.

Los metadatos han estado con nosotros desde que los primeros bibliotecarios compi-laron las primeras listas de contenidos de sus depósitos. En su acepción más generalmetadatos son datos sobre datos. En la era de Internet hace referencia a lo que losbibliotecarios han colocado en sus catálogos durante años con el nombre de informa-ción bibliográfica y que normalmente se refiere a información descriptiva sobre recur-sos web. Un registro de metadatos se compone de un conjunto de elementos necesa-rios para describir un recurso particular.

El enlace entre un registro de metadatos y el recurso o documento que describe puedehacerse bien en forma de registro de una base de datos externa al recurso o bienembebido dentro del mismo recurso. Mientras la primera opción es la más utilizada porlas bibliotecas para construir bases de datos de recursos electrónicos, la segunda esla más apropiada para las editoriales y otros proveedores de contenidos. De hecho, laseditoriales vienen proporcionando metadatos embebidos dentro de las publicacionesimpresas en la forma de CIP (Catalogación en Publicación)60 con el objeto de propor-cionar a los bibliotecarios unos datos bibliográficos básicos para incluir en los catálo-gos. En el ámbito electrónico la iniciativa TEI permite embeber metadatos en el enca-bezamiento de un texto electrónico.

En la actualidad, existen multitud de estándares de metadatos. Por ejemplo la comuni-dad de bibliotecarios utilizan de forma generalizada el formato MARC (MachineReadable Cataloguing)61. Por otro lado, en el ámbito de la descripción de recursos elec-trónicos se ha generalizado el uso del Dublin Core62.

Dublin Core es un conjunto simple pero efectivo para describir un amplio rango derecursos disponibles en la red. Incluye dos niveles, simple y cualificado. El Dublin Coresimple se compone de quince elementos de descripción, mientras que el cualificadoañade uno más (audiencia) así como una serie de limitadores (cualificadores) que refi-nan la semántica de los elementos de alguna forma que facilite la localización de losrecursos.

Los objetivos de la iniciativa son básicamente cuatro: Crear un sistema de metadatos simple tanto para la creación de registros como para su mantenimiento.

Una semántica de los elementos común para toda la comunidad de usuarios deInternet. Por ejemplo, mientras en el área científico-técnica se puede estar interesa-do en localizar artículos de un particular autor, en museos se puede necesitar saber

318

qué obras pertenecen a un determinado artista. Así ambas comunidades puedenponerse de acuerdo en utilizar un elemento de descripción denominado «creador».

Un alcance internacional. Aunque fue desarrollado originalmente en inglés a partir deuna iniciativa de OCLC (Online Computer Library Center) y NCSA (National Centerfor Supercomputing Applications) a mediados de los años noventa, se han elabora-do versiones en otros idiomas, entre ellos el español63 y catalán64.

Una «extensibilidad». Aunque simple, se reconoce la posibilidad de que en el futurose necesiten nuevos elementos para describir nuevos recursos o para mejorar larecuperación de los mismos.

A continuación se detallan los quince elementos básicos de Dublin Core. Hay que teneren cuenta que todos ellos pueden matizarse con algún cualificador65:

DC.Title. El nombre dado a un recurso, usualmente por el autor. DC.Creator. La persona u organización responsable de la creación del contenidointelectual del recurso. Por ejemplo, los autores en el caso de documentos escritos,artistas, fotografos e ilustradores en el caso de recursos visuales.

DC.Subject. Los tópicos del recurso. Típicamente, Subject expresará las claves o fra-ses que describen el título o el contenido del recurso. Se fomentará el uso de voca-bularios controlados y de sistemas de clasificación formales.

DC.Description. Una descripción textual del recurso, tal como un resumen en el caso de un documento o una descripción del contenido en el caso de un documentovisual.

DC.Publisher. La entidad responsable de hacer que el recurso se encuentre dispo-nible en la red en su formato actual, por ejemplo la empresa editora, un departamen-to universitario u otro tipo de organización.

DC.Contributor. Una persona u organizacion que haya tenido una contribución inte-lectual significativa en la creación del recurso pero cuyas contribuciones son secun-darias en comparación a las de las personas u organizaciones especificadas en elelemento Creator (por ejemplo, editor, ilustrador y traductor).

DC.Date. Una fecha en la que el recurso se puso a disposición del usuario en suforma actual. Esta fecha no ha de confundirse con la que pertenece al elementoCoverage, que sería asociada con el recurso sólo en la medida en que el contenidointelectual está de algún modo relacionado con esa fecha.

DC.Type. La categoría del recurso, por ejemplo, página personal, romance, poema,minuta, diccionario. Para asegurar la interoperabilidad, Type debería ser selecciona-do de entre una lista de valores que actualmente se encuentra bajo desarrollo en ungrupo de trabajo.

DC.Format. El formato de datos de un recurso, usado para identificar el software yposiblemente, el hardware que se necesitaría para mostrar el recurso. Para asegu-rar la interoperabilidad, los valores de Format deberían ser seleccionados de entreuna lista de valores que actualmente se encuentra bajo desarrollo en un grupo detrabajo.

DC.Identifier. Secuencia de caracteres usados para identificar unívocamente unrecurso. Ejemplos para recursos en línea pueden ser URLs y URNs (cuando esténimplementados). Para otros recursos pueden ser usados otros formatos de identifi-cadores, como por ejemplo ISBN (International Standard Book Number, NúmeroInternacional Normalizado para Libros).

DC.Source. Secuencia de caracteres utilizado para identificar unívocamente un tra-bajo a partir del cual proviene el recurso actual.

319

DC.Language. Lengua/s del contenido intelectual del recurso. Practicamente el con-tenido de este campo debería coincidir con los de la RFC 176666; por ejemplo: en,es, de, fi, ja y zh.

DC.Relation. Un identificador de un segundo recurso y su relación con el recursoactual. Este elemento permite enlazar los recursos relacionados y las descripcionesde los recursos. Por ejemplo:

IsVersionOf. Incluye la edición de un trabajo. IsBasedOn. La traducción de un trabajo. IsPartOf. Un capítulo de un libro. IsFormatOf. Un mecanismo de transformación de un conjunto de datos enuna imagen.

Para asegurar la interoperabilidad, las relaciones deberían ser seleccionadas de unalista de elementos que actualmente se encuentra bajo desarrollo en un grupo de tra-bajo.

DC.Coverage. La característica de cobertura espacial y/o temporal del contenido intelectual del recurso. La cobertura espacial se refiere a una región física, uso decoordenadas (por ejemplo, longitud y latitud) o nombres de lugares extraídos de unalista controlada. La cobertura temporal se refiere al contenido del recurso en vez dea cuando fue creado o puesto accesible ya que este último pertenece al elementoDate.DC.Rights. Una referencia (URL, por ejemplo) para una nota sobre derechos de autor, para un servicio de gestión de derechos o para un servicio que dará informa-ción sobre términos y condiciones de acceso a un recurso. Una especificación for-mal del elemento Rights se encuentra actualmente en discusión y, por lo tanto, suuso se considera experimental.

En cuanto a la sintaxis, la norma no especifica ninguna en particular y dependerá de laforma en que se utilice el Dublin Core. Ya hemos dicho que en el ámbito de esta guía lomás acertado sería embeber los elementos en los propios documentos, así podríamostener diferentes sintaxis dependiendo que usemos HTML67 o XML68.

ESTÁNDARES DE ACCESIBILIDAD Y USABILIDAD

A la hora de diseñar un documento y, en general, un sitio web debemos hacernos lapregunta: ¿cómo es de accesible? En la búsqueda de la mayor audiencia posible debemospensar que puede ser visitado por personas con problemas de audición, de visión u otrotipo de discapacidad. Algunos estudios sugieren que el 4,5% de los visitantes tienen algúntipo de problema con la percepción de los colores69. Además, hay que tener en cuenta queno todo el mundo dispone del mismo visualizador, el mismo ordenador o el mismo tipo deconexión a Internet. El W3C advierte a los desarrolladores que muchos usuarios estaránfuncionando desde contextos muy diferentes, por ejemplo, pueden:

No ser capaces de ver, oir, moverse, o ser incapaces de procesar algún tipo de infor-mación.

Disponer solamente de una pantalla en modo texto, una pantalla pequeña o una conexión muy lenta.

Tener dificultades para leer el texto. No hablar o entender perfectamente el lenguaje en que se ha escrito el documento.

320

No disponer o no ser capaces de usar un teclado o un ratón. Estar en una situación donde sus ojos, oídos o manos estén ocupados. Tener una versión antigua de visualizador, diferentes modelos de visualizador inclu-yendo visualizadores basados en voz, o disponer de un sistema operativo totalmen-te diferente.

Teniendo en cuenta toda esta casuística, el W3C70 hace las siguientes recomendacio-nes para garantizar la accesibilidad a un sitio web:

Proporcionar alternativas cuando se utilice un contenido audiovisual. En general, losdocumentos audiovisuales necesitan unos requisitos de hardware y software que noestán al alcance de todos los usuarios, por ello es necesario proporcionar la informa-ción equivalente en texto.

Asegurar que texto y gráficos son legibles cuando se visualicen sin colores. Utilizar las marcas de HTML para identificar la estructura del texto de forma apropia-da. Igualmente hay que controlar la apariencia del texto utilizando hojas de estilo enlugar de elementos de presentación propios de HTML.

Utilizar marcas que faciliten la pronunciación o interpretación de textos abreviados oescritos en otras lenguas. Por ejemplo utilizando las marcas «xml:lang» en XML outilizando los elementos ABBR y ACRONYM de HTML.

Asegurarse de que las tablas utilizan un marcado apropiado que permita visualizar-las en todo tipo de plataformas.

Asegurarse de que las páginas sean accesibles incluso cuando las más modernastecnologías no estén soportadas o estén deshabilitadas en el sistema del usuario.

Asegurarse de que los objetos con movimiento o que se actualizan automáticamen-te pueden ser pausados o parados por el usuario.

Diseñar páginas que sean independientes de los periféricos. Por ejemplo, si un con-trol sólo puede ser activado con un ratón, alguien que esté usando la página con otrodispositivo de puntero o desde un sistema adaptado para invidentes, o simplementeusando un teclado, no sería capaz de utilizarlo.

Además de accesible el sitio web debe ser fácilmente utilizable. El concepto de usabi-lidad se ha popularizado en los últimos años. A grandes rasgos define todas aquellascaracterísticas que hacen que los usuarios que acuden a nuestro sitio web se sientancómodos en él y encuentren la información que necesitan de la forma más rápida posible.A no ser que un sitio web responda a las necesidades de los usuarios a los que va dirigi-do, tampoco cumplirá con las necesidades de la organización que lo mantiene.

Que un sitio sea usable es hoy en día uno de los principales requerimientos para laaceptación por parte de los usuarios. Por ejemplo, en comercio electrónico, un usuarioinsatisfecho con nuestro sitio por ser poco amigable, seguramente se convertirá en uncliente de la competencia.

Entre los errores que pueden hacer poco utilizable un sitio web y que cabría evitardesde el principio, tenemos71:

Reproducir en el sitio los intereses y la estructura interna de la organización en lugarde orientarlos a solucionar las necesidades de los usuarios.

Ofrecer materiales no adaptados para ser presentados en la Web. No someter el proceso de creación de la página web a los criterios de calidad que

321

322

se utilizan para otros tipos de publicaciones. Así la publicación en web proporcionauna oportunidad única para que proveedores de contenidos con poca experiencia eneste campo creen una nueva generación de sistemas de difícil utilización. Para crearpáginas web es necesario la combinación de expertos en la materia a tratar,HTML/XML, diseño gráfico y arquitectura y usabilidad de la información.

Un buen diseño, junto con el establecimiento de alguna metodología de evaluaciónayudarán a crear un sitio web usable72, 73. Existen multitud de guías74, 75 de usabilidad desitios web. Es de obligada referencia la página de Nielsen: useit.com76, quien es autor tam-bién de varios libros sobre el tema. A la hora de proporcionar unas pautas básicas que todositio debería seguir podemos seguir las Research-Based web design and usability guideli-nes77:

Durante el proceso de diseño y evaluación se deben establecer unos objetivos acumplir por el sitio web, proporcionar un contenido útil que entienda y responda a lasnecesidades de los usuarios.

Optimizar el tiempo que el usuario pase en el sitio web a través de: Mostrar la información en un formato directamente utilizable, es decir, sin que el usuario necesite instalar aplicaciones adicionales.

No mostrar ventanas o gráficos innecesarios. Proporcionar ayuda a los usuarios y hacerlo en un lenguaje comprensible paraellos.

Minimizar el tiempo de descarga de las páginas. Reducir la carga de trabajo y cognitiva del usuario. Informar sobre los tiempos de descarga estimados cuando se trate de ficherosmuy grandes.

Desarrollar páginas que se puedan imprimir correctamente. En cuanto al hardware y software, se debe diseñar para:

Los visualizadores más comunes y teniendo presente también los más minorita-rios.

Los sistemas operativos más habituales. Las velocidades de conexión más frecuentes. Las resoluciones de pantalla más comunes.

En el diseño de las páginas se debe: Establecer la longitud de la página y de las líneas más apropiada. Establecer niveles de importancia, colocando la información más importante en elárea superior de la pantalla.

Navegación: Mantener al usuario informado en todo momento del lugar donde se encuentra. En caso de páginas muy largas se debe crear una lista de contenidos. No crear páginas sin opciones de navegación (callejones sin salida). Utilizar mapas del sitio. Utilizar entradas apropiadas en los menús que de verdad respondan a lo que el usuario va a encontrar en los enlaces.

Apariencia del texto: Utilizar texto en negro sobre un fondo plano y de alto contraste. Asegurar la consistencia visual. Usar fuentes familiares al usuario y de, al menos, 12 puntos.

Gráficos e imágenes: Utilizar vídeo, animaciones y audio con mucha cautela.

Limitar el uso de imágenes de gran tamaño. Añadir etiquetas a las imágenes que escondan algún enlace.

Contenidos: Usar acrónimos y abreviaturas sólo si es imprescindible. Usar palabras familiares para el usuario evitando el lenguaje coloquial. Organizar los contenidos de forma clara y precisa. Colocar la información más importante al comienzo de la página. Agrupar los elementos que estén relacionados. Mostrar sólo la información que sea útil y necesaria. Formatear la información teniendo en cuenta distintos tipos de audiencias.

323

GLOSARIO

Imagen digital. Una imagen digital es una «fotografía electrónica» compuesta por unnúmero determinado de puntos, llamados píxeles, que forman una matriz con filas y colum-nas. Cuanto mayor sea el número de filas y columnas mayor será el detalle de la imageny mayor también su tamaño de archivo. Cada píxel de una imagen almacena informaciónde su tono o luminosidad, donde el tono negro es el valor 0 y el blanco el valor más alto,normalmente 255 en la escala de grises, pero representados en formato binario. El forma-to binario es una notación numérica que utiliza solamente dos dígitos (cero y uno) pararepresentar las cifras.

Píxel. Normalmente las cifras binarias se componen de un número total de ceros y unosque es potencia de 2, como 8, 16, 32 etc. A cada uno de estos unos o ceros se les llamabit y a un conjunto de 8 bits, byte. En un byte, el primer bit tiene un valor de 1, el segundode 2, el tercero 4, el cuarto 8 y así sucesivamente. El número más bajo que puede conte-ner un byte es 0 (00000000) y el más alto 255 (11111111). El número de bits utilizado pararepresentar un píxel en una imagen determina el número de colores o variantes de gris quepueden ser representados en una imagen digital. Esto es lo que se denomina profundidadde color o de bit.

Profundidad de color. En una imagen en escala de grises cada punto se almacena en unbyte, donde su valor numérico representa su tono que puede oscilar entre el blanco (255)y el negro (0). Esto quiere decir que es una imagen donde existen 256 tonos de gris. Esdecir, la profundidad de color es el número de bits que definen cada píxel, que determinanel máximo número de colores que pueden tener. Si cada píxel viene determinado por 2bytes (= 16 bits) existirán 65.536 tonos de gris y así sucesivamente. Una imagen digital encolor se genera con sus componentes R, G y B (del inglés red, green y blue). Así pues secompondría de tres imágenes, una por cada color. La suma de las tres hace la imagenfinal. Cada píxel va definido por 3 bytes, uno por cada color. Si cada uno de ellos tiene unagama de color de 255 tonos, en la imagen final habrá una gama de 16.777.216 colores(256 x 256 x 256) que se suele abreviar como «16 millones de colores». Es lo que se llamauna imagen con una profundidad de color de 24 bits (8 por cada color).

Tamaño de imagen. Se define como las dimensiones en píxeles de la matriz o cuadrícu-la. Si una imagen está formada por una matriz de 800 columnas por 500 filas, tiene enton-ces un tamaño de 800 x 500 píxeles.

Tamaño de archivo. Es la cantidad de información que contiene, medida en bits o en algu-no de sus múltiplos: bytes, Megabytes, etc.

Resolución. Es la medida de la cantidad de píxeles por unidad de longitud, comúnmentepíxeles por pulgada (una pulgada equivale a 2,54 cm de longitud). Se suele abreviar comoppp o dpi (puntos por pulgada o dots per inch). De esta definición se deduce que a mayorresolución, mayor número de puntos de imagen en el mismo espacio, y por tanto mayordefinición. Por ejemplo, si una imagen tiene unas dimensiones en píxeles de 548 x 366 yse imprime o se está mostrando en pantalla con unas dimensiones de 2 x 3 pulgadas,entonces tiene una resolución de 72 dpi. Debe quedar claro que la resolución es la rela-ción entre las medidas digitales (medidas en píxeles) y las físicas (las que tiene una vezimpresa, o en el dispositivo que se está visualizando). La resolución no es una medida dela calidad de una imagen digital, aunque a menudo se utilice para ello. Es una medida denitidez o definición, de forma que cuanto más alta sea, mayor definición y viceversa.

324

Compresión. La compresión se utiliza para reducir el tamaño de los ficheros de imágenespara ser procesados más fácilmente, almacenados o comunicados a través de Internet.Los métodos utilizados se basan, generalmente, en abreviar información repetida o elimi-nar información que el ojo humano tiene dificultades para apreciar. Por lo tanto, la calidadde una imagen puede verse afectada por las técnicas de compresión utilizadas o por elnivel de compresión aplicado. Las técnicas de compresión pueden ser «sin pérdida» quesignifica que cuando la imagen descomprimida será idéntica a su estado inicial ya que nose ha eliminado ninguna información o «con pérdida» cuando sí que se elimine algunainformación.

325

1 Electronic publishing: guide to best practices for canadian publishers (en línea). NatinalLibrary of Canada, 2001. <http://www.collectionscanada.ca/9/13/index-e.html> (Consulta:28 de julio de 2004).2 D i g i C U LT H o m e P a g e ( e n l í n e a ) . <http://www.cordis.lu/ist/directorate_e/digi-cult/index.htm> (Consulta: 28 de julio de 2004).3 MINERVA EUROPE. Digitisation Guidelines: a selected list (en línea). Minerva Europe,2003. <http://www.minervaeurope.org/guidelines.htm> (Consulta: 28 de julio de 2004).4 MINERVA EUROPE. Good Practices Handbook version 1.3 (en línea). Minerva Europe,2004. <http://www.minervaeurope.org/structure/workinggroups/goodpract/document/good-practices1_3.pdf> (Consulta: 28 de julio de 2004).5 MINERVA EUROPE. Technical Guidelines for Digital Cultural Content CreationP r o g r a m m e s ( e n l í n e a ) . M i n e r v a E u r o p e , 2 0 0 4 . <http://www.minervaeuro-pe.org/structure/workinggroups/servprov/documents/techguid1_0.pdf> (Consulta: 28 dejulio de 2004).6 INTERNATIONAL FEDERATION OF LIBRARIES ASSOCIATIONS. Guidelines for digiti-zation projects for collections and holdings in the public domain, particularly those held bylibraries and archives (en línea). IFLA, 2002. <http://www.ifla.org/VII/s19/pubs/digit-guide.pdf> (Consulta: 28 de julio de 2004).7 Digital Library of Georgia (en línea). Digital Library of Georgia, 2001.<http://dlg.galileo.usg.edu/guide.html> (Consulta: 28 de julio de 2004).8 COINE. Guide to digitization (en línea). COINE, 2002. <http://www.uoc.e-du/in3/coine/eng/deliverables/Guide_to_digitization_Task3_6.pdf> (Consulta: 28 de julio de2004).9 CORNELL UNIVERSITY LIBRARY. Moving Theory into Practice: Digital Imaging Tutorial(en línea). Cornell University Library, 2003. <http://www.library.cornell.edu/pre-servation/tutorial/contents.html> (Consulta: 28 de julio de 2004).10 FUTURA, Richard, Defining and using structure in digital documents (en línea),Proceedings of the First Annual Conference on the Theory and Practice of Digital Libraries,June 19-21, 1994 - College Station, Texas, USA.<http://www.csdl.tamu.edu/DL94/pa-per/furuta.html> (Consulta: 28 de julio de 2004).11 COOMBS, James H. ; RENEAR, Allen H. ; DEROSE, Steven J. Markup systems and thefuture of scholarly text processing, Communications of the ACM, 30, 1987, págs. 933-947.12 FUTURA, Richard. Op. Cit. 13 KASDORF, Bill. SGML and PDF: why we need both (en línea), Journal of ElectronicPublishing, 1998. Vol. 3, núm 4. <http://www.press.umich.edu/jep/03-04/kasdorf.html >(Consulta: 28 de Julio de 2004).14 Internet Engineering Task Force (en línea) <http://www.ietf.org> (Consulta: 28 de julio de2004).15 World Wide Web Consortium (en línea) <http://w3c.org> (Consulta: 28 de julio de 2004).16 BERNERS-LEE, T. ; CONNOLLY, D. Hypertext Markup Language - 2.0 (en línea) InternetEngineering Task Force, 1996. <http://www.ietf.org/rfc/rfc1866.txt?number=1866>(Consulta: 28 de julio de 2004).17 HyperText Markup Language (HTML) Home Page (en línea). <http://www.w3.org/Mark-Up/> (Consulta: 28 de julio de 2004).

326

18 PARNAS, Dagfinn. How to cope with incorrect HTML (en línea). Tesis de licenciatura,Universidad de Bergen, Departamento de Informática, 2001. <http://www.ub.uib.no/el-pub/2001/h/413001/Hovedoppgave.pdf> (Consulta: 28 de julio de 2004).19 LIEB, Tom. The X (HTML) Files (en línea). Journal of Electronic Publishing, 2000. Vol5, núm. 4. <http://www.press.umich.edu/jep/05-04/lieb0504.html> (Consulta: 28 de juliode 200).20 HighWire Press (en línea). <http://highwire.stanford.edu> (Consulta: 28 de julio de2004).21 ScienceDirect (en línea). <http://www.sciencedirect.com> (Consulta: 28 de julio de2004).22 SpringerLink (en línea). <http://www.springerlink.com> (Consulta: 28 de julio de 2004).23 What is Adobe PDF? [en línea]. Adobe Systems, 2004. http://www.adobe.com/pro-ducts/acrobat/adobepdf.html> (Consulta: 28 de julio de 2004).24 PDF Reference : Adobe Portable Document Format 1.3. Boston : Addison-Wesley2000.25 Macromedia Director (en línea). <http://www.macromedia.com/software/director/pro-ductinfo/features/> (Consulta: 28 de julio de 2004).26 Macromedia Flash (en línea)<http://www.macromedia.com/software/flash/productinfo/features/> (Consulta: 28 de juliode 2004).27 Showcase. Macromedia (en línea). <http://www.macromedia.com/cfusion/showca-se/index.cfm> (Consulta: 28 de julio de 2004).28 Rich Text Format Specification, version 1.6 (en línea). Microsoft Corporation, 1999.<http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dnrtfspec/html/RTFSpec_1.asp> (Consulta: 28 de julio de 2004).29 Microsoft Word (en línea). <http://msdn.microsoft.com/library/en-us/dnanchor/html/odc_ancword.asp> (Consulta: 28 de julio de 2004).30 Microsoft Reader (en línea). <http://www.microsoft.com/reader> (Consulta: 28 de juliode 2004).31 Showcase. Microsoft Reader (en línea).<http://www.microsoft.com/reader/us/shop/default.asp> (Consulta: 28 de Julio de 2004).32 HICKS, Tony. Should we be using ISO 12083? (en línea). Journal of ElectronicPublishing, 1998. Vol. 3, núm 4. <http://www.press.umich.edu/jep/03-04/hicks.html>(Consulta: 28 de julio de 2004).33 SGML/XML: Academic Applications (en línea). CoverPages, 2004. <http://xml.coverpa-ges.org/acadapps.html> (Consulta: 28 de julio de 2004).34 Extensible Markup Language (XML) 1.0 (Third Edition) (en línea), World Wide WebConsortium, 2004. <http://www.w3.org/TR/REC-xml/> (Consulta: 28 de julio de 2004).35 XSL Transformations (XSLT) Versión 1.0 (en línea). World Wide Web Consortium,2004. <http://www.w3.org/TR/xslt> (Consulta: 28 de julio de 2004).36 Text Encoding Initiative (en línea). <http://www.tei-c.org/> (Consulta: 28 de julio de2004).37 SPERBERG-MCQUEEN, C. M. and BURNARD, L. (eds.) (2002). TEI P4: Guidelinesfor Electronic Text Encoding and Interchange (en línea). Text Encoding InitiativeConsortium. XML Version: Oxford, Providence, Charlottesville, Bergen.<http://www.teic.org/P4X/> (Consulta: 28 de julio de 2004).38 Projects using the TEI (en línea). Text Encoding Initiative, 2004.http://www.teic.org/Appli-cations/index.html> (Consulta: 28 de julio de 2004).39 Teach yourself TEI (en línea). Text Encoding Initiative, 2003.

327

<http://www.teic.org/Tutorials/index.html> (Consulta: 28 de julio de 2004).40 Open eBook Forum (en línea). <http://www.openebook.org> (Consulta: 28 de julio de2004).41 Open eBook Publication Structure (en línea). Open e-book Forum, Publication StructureWorking Group, 2002. <http://www.openebook.org/oebps/oebps1.2/index.htm> (Consulta:28 de julio de 2004).42 Cascading Style Sheets home page (en línea). W3C, 2004. <http://www.w3.org/Sty-le/CSS/> (Consulta: 28 de julio de 2004).43 http://www.openebook.org/oebps/oebps1.2/samples/Wuthering%20Heights%20-(OEBPS%201.2).zip (Consulta: 28 de julio de 2004).44 CervanTeX (en línea). <http://www.cervantex.org> (Consulta: 28 de julio de 2004).45 CASCALES SALINAS, Bernardo. LaTeX: una imprenta en sus manos. ADI, 2000.46 MITTELBACH, Frank et al. The LaTeX companion, 2/E. Addison Wesley Professional,2004.47 JENNINGS, Tom. ASCII: American Standard Code for Information Interchange (en línea)2001. <http://www.wps.com/projects/codes/> (Consulta: 28 de julio de 2004).48 Unicode Home Page (en línea). <http://www.unicode.org> (Consulta: 28 de julio de2004).49 The Unicode Standard, version 4.0 (en línea). Unicode Consortium, 2003.<http://www.unicode.org/versions/Unicode4.0.1/> (Consulta: 28 de julio de 2004).50 http://www.wordiq.com/definition/UTF-2000 (Consulta: 28 de julio de 2004).51 http://www.wordiq.com/definition/Giga_Character_Set (Consulta: 28 de julio de 2004).52 NIELSEN, Jacob. Effective use of style sheets (en línea). 1997.<http://www.useit.com/alertbox/9707a.html> (Consulta: 28 de julio de 2004).53 Cascading Style Sheets, level 2 revision 1 (en línea). World Wide Web Consortium,2004. <http://www.w3.org/TR/CSS21/> (Consulta: 28 de julio de 2004).54 Style master online tutorial (en línea). Western Civilisation pty. ltd., 2004.<http://www.westciv.com/style_master/academy/hands_on_tutorial/index.html> (Consulta:28 de julio de 2004).55 XSL Transformations (XSLT) Version 1.0 (en línea). World Wide Web Consortium, 1999.<http://www.w3.org/TR/xslt> (Consulta: 28 de julio de 2004).56 KAY, Michael. XSLT Programmer’s reference. Wrox Press, 2000.57 MANGANO, Sal. XSLT Cookbook. O’Reilly & Associates, 2002.58 THE EXTENSIBLE STYLESHEET LANGUAGE FAMILY (XSL) (en línea). WORLD WIDEWEB CONSORTIUM, 1999. <http://www.w3.org/Style/XSL/> (Consulta: 28 de julio de2004).59 COUTIN DOMÍNGUEZ, Adrián. Arquitectura de información para sitios web. AnayaMultimedia, Madrid, 2002.60 Cataloguing in Publication Program (en línea). The Library of Congress.<http://cip.loc.gov/> (Consulta: 28 de julio de 2004).61 MARC Standards (en línea). Library of Congress. <http://www.loc.gov/marc/> (Consulta:28 de julio de 2004).62 Dublin Core Metadata Initiative (en línea). <http://www.dublincore.org> (Consulta: 28 dejulio de 2004).63 MASA, Javier. Metainformación Dublin Core : Elementos del conjunto de metadatos deDublin Core: descripción de referencia (en línea). RedIris, 2003.<http://www.rediris.es/-metadata/> (Consulta: 28 de julio de 2004).64 Conjunt dels elements de metadades del Dublin Core, Versió 1.1: Descripció de referen-cia (en línea). Biblioteca de Catalunya, 2001. <http://www.gencat.net/bc/dces.htm>

328

(Consulta: 28 de julio de 2004).65 Dublin Core Qualifiers (en línea). Dublin Core Initiative, 2000. <http://dublincore.org/-documents/2000/07/11/dcmes-qualifiers/> (Consulta: 28 de julio de 2004).66 ALVESTRAND, H. Tags for the Identification of Languages RFC 1766 (en línea). IETF,1995. <http://www.ietf.org/rfc/rfc1766.txt> (Consulta: 28 de julio de 2004).67 KUNZE, J. Encoding Dubin Core Metadata in HTML RFC 2731 (en línea). IETF, 1999.<http://www.ietf.org/rfc/rfc2731.txt> (Consulta: 28 de julio de 2004).68 POWELL, Andy. Guidelines for implementing Dublin Core in XML (en línea). Dublin CoreMetadata Initiative, 2003. <http://dublincore.org/documents/dc-xml-guidelines/> (Consulta:28 de julio de 2004).69 Caslon Analytics online accessibility guide (en línea). <http://www.caslon.com.au/acces-sibilityguide1.htm> (Consulta: 28 de julio de 2004).70 Web Content Accessibility Guidelines 1.0 [en línea]. World Wide Web Consortium, 1999.<http://www.w3.org/TR/1999/WAI-WEBCONTENT-19990505/> (Consulta: 28 de julio de2004).71 Design guidelines for the web (en línea). UsabilityNet, 2003. <http://www.usability-net.org/tools/webdesign.htm> (Consulta: 28 de julio de 2004).72 SCAPIN, Dominic et al. A Framework for Organizing Web Usability Guidelines (en línea).<http://www.tri.sbc.com/hfweb/scapin/Scapin.html> (Consulta: 28 de julio de 2004).73 NIELSEN, J. ; MACK, R.M., Usability Inspection Methods. John Wiley & Sons, New York,1994.74 Web Design Guidelines: Design in Action (en línea). <http://www-3.ibm.com/ibm/easy/eou_ext.nsf/Publish/572> (Consulta: 28 de julio de 2004).75 Web Style Guide (en línea). <http://www.webstyleguide.com/index.html> (Consulta: 28de julio de 2004).76 NIELSEN, J. Useit.com (en línea). <http://useit.com> (Consulta: 28 de julio de 2004).77 Research-Based web design and usability guidelines (en línea). National CancerInstitute, 2001. <http://usability.gov/guidelines/> (Consulta: 28 de julio de 2004).

329

Capítulo 6: La edición digital

Documents

Transcript of Capítulo 6: La edición digital