UNIDAD 3

50
Lenguaje de Representacion Los lenguajes de marcas, también denominados lenguajes de marcado o lenguajes de descripción de documentos, construyen un conjunto de reglas que definen todo aquello que es parte de un documento digital , pero que no pertenece al texto del mismo. Los lenguajes de marcas no son lenguajes de formato similares a los lenguajes que se usan en Internet como los de descripción de páginas (archivos PostScript , archivos .pdf , etc.) ni son lenguajes de programación (Java , Perl , C++...), sino que se trata de lenguajes orientados a definir la estructura y la semántica de un documento. En realidad, más que de lenguajes, podríamos hablar de metalenguajes o sistemas formales mediante los cuales se añade información o codificación a la forma digital de un documento bien para controlar su procesamiento, bien para representar su significado. En un documento existen distintos niveles de información: por un lado, los datos que conforman el contenido de un documento (caracteres de contenido), y por otro, una información superpuesta al contenido, que es lo que constituye el etiquetado, marcado o "markup" (caracteres de etiquetado). Un lenguaje de marcado cumple con dos objetivos esenciales a la hora de diseñar y procesar un documento digital : Especifica las operaciones tipográficas y las funciones que debe ejecutar el programa navegador/visualizador sobre dichos elementos. Las operaciones tipográficas son instrucciones de formato que se aplican a cada uno de los elementos de un documento digital como, por ejemplo, imprimir un título en negrita y a un determinado tamaño.

description

word

Transcript of UNIDAD 3

Lenguaje de RepresentacionLos lenguajes de marcas, tambin denominados lenguajes de marcado o lenguajes de descripcin de documentos, construyen un conjunto de reglas que definen todo aquello que es parte de un documento digital, pero que no pertenece al texto del mismo. Los lenguajes de marcas no son lenguajes de formato similares a los lenguajes que se usan en Internet como los de descripcin de pginas (archivos PostScript, archivos .pdf, etc.) ni son lenguajes de programacin (Java, Perl, C++...), sino que se trata de lenguajes orientados a definir la estructura y la semntica de un documento.En realidad, ms que de lenguajes, podramos hablar de metalenguajes o sistemas formales mediante los cuales se aade informacin o codificacin a la forma digital de un documento bien para controlar su procesamiento, bien para representar su significado.En un documento existen distintos niveles de informacin: por un lado, los datos que conforman el contenido de un documento (caracteres de contenido), y por otro, una informacin superpuesta al contenido, que es lo que constituye el etiquetado, marcado o "markup" (caracteres de etiquetado).Un lenguaje de marcado cumple con dos objetivos esenciales a la hora de disear y procesar un documento digital: Especifica las operaciones tipogrficas y las funciones que debe ejecutar el programa navegador/visualizador sobre dichos elementos. Las operaciones tipogrficas son instrucciones de formato que se aplican a cada uno de los elementos de un documento digital como, por ejemplo, imprimir un ttulo en negrita y a un determinado tamao. Separa un texto en los elementos de los que se compone, como por ejemplo un prrafo, un captulo, un encabezamiento, etc.As, pues, hay 2 tipos de marcacin: especfica: describe cmo ha de formatearse el documento: fuente, tamao, color, etc. estructural: describe la estructura del documento: titular, prrafo, etc.En general los lenguajes de marcado siguen una sintaxis basada en el uso de marcas o etiquetas: una etiqueta que indica el principio de un elemento y otra el final del mismo.Por regla general, la mayor parte de autores distinguen 2 tipos bsicos de lenguajes de marcado: Lenguaje de marcado de procedimiento o procesado: Las anotaciones o marcas de los lenguajes de procedimiento describen la forma y el significado de las operaciones tipogrficas que van a ser aplicadas a cada uno de los elementos del documento. Por ejemplo, una regla de un lenguaje de procedimiento indicara que el ttulo de la seccin de un texto debe ser impreso en una sola lnea con una fuente de seis puntos ms grande que el resto del texto, con objeto de que los lectores puedan inferir que es el ttulo. Se refiere, pues, a la apariencia fsica o formato (fuente, estilo de letra, tamao, etc.) tanto del documento en pantalla como del documento impreso. Lenguaje de marcado estructural o descriptivo: En los lenguajes estructurales las marcas o anotaciones nicamente describen la estructura lgica del documento digital y/o la descripcin del contenido, no su tipografa.Aunque lo cierto es que existen 3 utilizaciones bsicas de los lenguajes de marcas: los que sirven principalmente para describir el contenido (por ejemplo, las bases de datos), los que sirven para definir el formato (por ejemplo, los procesadores de textos) y los que realizan las dos funciones indistintamente (por ejemplo, el lenguaje HTML). Cmo surgen los lenguajes de marcado?Dada la gran variedad de formatos existentes a la hora de archivar documentos y de los problemas que se planteaban cuando se intercambiaban archivos con las consiguientes prdidas de formato y otras caractersticas, todos estos problemas se intentaron solucionar editando los textos en cdigo ASCII (American Standard Code for Information Interchange) el cdigo de 7 bits que puede representar un mximo de 128 caracteres, muchos de ellos no imprimibles. Sin embargo, con la utilizacin de este cdigo, no se poda definir el formato de un texto (por ejemplo, el uso de negrita o cursiva, o el uso de tipos de letra ms grandes para los encabezamientos), ni se podan definir otras caractersticas relativas a la posicin del texto, por lo que se intent buscar un sistema de marcas con las que se pudieran determinar stas y otras particularidades.Se acord, pues, que las marcas deberan constar de unos caracteres ASCII especialmente reservados para ello y que deberan seguirse unas reglas sintcticas especiales. As naci un lenguaje especial normalizado internacional para la formulacin de este tipo de reglas llamado Standard Generalized Markup Language o SGML. SGML no es pues, un lenguaje en s mismo, sino un metalenguaje y de l se deriva el lenguaje HTML o lenguaje de marcas de hipertexto, y otros muchos lenguajes. SGMLSGML (Standard Generalized Markup Language) o Lenguaje de Etiquetado Generalizado Estndar es una norma ISO que permite que la estructura de un documento pueda ser definida en base a la relacin lgica de sus partes. Esta estructura puede ser validada por una Definicin de Tipo de Documento (DTD - Document Type Definition). La norma SGML define la sintaxis del documento y la sintaxis y semntica de DTD.En 1969 IBM ide el lenguaje GML o Generalized Markup Language con el objetivo de crear un sistema general que permitiera la compatibilidad entre los documentos. En 1978, el Instituto Nacional Americano de Normalizacin (ANSI) comenz a trabajar en las especificaciones para los procesadores de textos yel resultado fue el lenguaje SGML, que se convirti en la Norma ISO 8879 en 1986.En SGML, el marcado de un fragmento de texto se realiza a travs de las etiquetas o marcas (tag). Estas marcas se diferencian del propio texto porque aparecen entre parntesis angulares < > en caracteres ASCII que, por tanto, se convierten en signos reservados para la sintaxis SGML.)Una pareja de marcas o etiquetas encierran el texto al que afectan. Veamos un ejemplo:En este texto, algunas palabras aparecen en negrita, otras en cursivay otras en negrita y cursivaque dara el siguiente resultado:En este texto, algunas palabras aparecen en negrita, otras en cursiva y otras en negrita y cursivaCon la sintaxis del lenguaje SGML se pretende poder identificar la estructura lgica de un documento a travs de estas marcas. Las etiquetas marcan los distintos elementos de un texto, como por ejemplo, los encabezamientos o los prrafos, representando de la misma forma los elementos de la misma categora. La presentacin final de estos elementos viene determinada por las especificaciones de estilo especiales.La funcin principal del SGML es describir los tipos de documentos de forma que puedan determinarse mediante marcas las particularidades de cada tipo, en lo que se refiere a su estructura y a su visualizacin en pantalla y con una sintaxis nica para definir las distintas partes del texto. Esto se realiza definiendo todas las etiquetas vlidas para cada tipo de documento, incluyendo tambin las reglas relativas a la estructura lgica.Con estas reglas se puede exigir, por ejemplo, que un texto que debe asignarse a un tipo de documento definido se inicie generalmente con un encabezamiento, pero nunca que acabe con un encabezamiento. Una definicin del tipo de documento o DTD (Document Type Definition) se guarda en un archivo especial con una extensin .dtd. Consta de una sucesin de comandos SGML enmarcados por los signos "