investigacion U2.docx

23
Programación Web Ing. Ivette Stephany Pacheco Farfan Lenguaje de Marcado Unidad: 2 ISMA-8

Transcript of investigacion U2.docx

ProgramacinWeb

Ing. Ivette Stephany Pacheco Farfan

Lenguaje de Marcado

Unidad: 2

ISMA-8

Presenta:Cesar Antonio Hernndez GernimoTabla de contenido

Introduccin3Definicin4Representacin de documentos4Tipo de datos bsicos6Tipo de datos bsicos en HTML7Elementos bsicos8Texto8Vnculos8Listas10Tablas10Objetos12Imgenes13Aplicaciones14Conclusin16Bibliografa17

Introduccin

Los lenguajes de marcas, tambin denominados lenguajes de marcado o lenguajes de descripcin de documentos, definen la estructura, la semntica y controlan el procesamiento de un documento digital. No son lenguajes de formato similares a los lenguajes que se usan en Internet como los de descripcin de pginas (archivos PostScript, archivos .pdf, etc.) ni son lenguajes de programacin (Java, Perl, C++).En un documento existen distintos niveles de informacin: por un lado, los datos que conforman el contenido de un documento (caracteres de contenido), y por otro, una informacin superpuesta al contenido, que es lo que constituye el etiquetado, marcado o "markup" (caracteres de etiquetado). En general una etiqueta indica el principio de un elemento y otra el final del mismo. Un lenguaje de marcado cumple con dos objetivos esenciales a la hora de disear y procesar un documento digital: Especifica las operaciones tipogrficas y las funciones que debe ejecutar el programa navegador/visualizador sobre dichos elementos. Las operaciones tipogrficas son instrucciones de formato que se aplican a cada uno de los elementos de un documento digital como, por ejemplo, imprimir un ttulo en negrita y a un determinado tamao. Separa un texto en los elementos de los que se compone, como por ejemplo un prrafo, un captulo, un encabezamiento, etc. Los lenguajes de marcas surgieron dada la gran variedad de formatos existentes a la hora de archivar documentos y de los problemas que se planteaban cuando se intercambiaban archivos con las consiguientes prdidas de formato y otras caractersticas. Se acord, pues, que las marcas deberan constar de unos caracteres ASCII especialmente reservados para ello y que deberan seguirse unas reglas sintcticas especiales.As naci un lenguaje especial normalizado internacional para la formulacin de este tipo de reglas llamado Standard Generalized Markup Language o SGML. SGML no es pues, un lenguaje en s mismo, sino un metalenguaje y de l se deriva el lenguaje HTML o lenguaje de marcas de hipertexto, y otros muchos lenguajes. Existen 3 utilizaciones bsicas de los lenguajes de marcas: Los que sirven principalmente para describir el contenido (por ejemplo, las bases de datos). Los que sirven para definir el formato (por ejemplo, los procesadores de textos). Los que realizan las dos funciones indistintamente (por ejemplo, el lenguaje HTML).

Definicin

Definicin 1: Un lenguaje de marcado o lenguaje de marcas es una forma de codificar un documento que, junto con el texto, incorpora etiquetas o marcas que contienen informacin adicional acerca de la estructura del texto o su presentacin.

Definicin 2: Un lenguaje de marcado es tambin conocido como lenguaje de marcas, ste trata de codificar un documento que es conformado por marcas tambin conocidas como etiquetas, las cuales estructuran la informacin dentro de una pgina en estilo HTML o con estilos de programacin especficos para la web como PHP, Java, SAP, etc.

Definicin 3: Qu es un lenguaje de marcas?Un lenguaje de marcas es un lenguaje que anota el texto de modo que el ordenador puede manipularlo. La mayora de los lenguajes de marcas son legibles debido a que las anotaciones estn escritas de forma tal que se puedan distinguir de los textos. Por ejemplo, con HTML, XML y XHTML, las etiquetas de formato son y . El texto que aparece dentro de uno de esos delimitadores se considera parte del lenguaje de marcado y no parte del texto anotado.Por ejemplo: p este es un prrafo de texto escrito en HTML /p Representacin de documentos

En el mundo de los documentos en papel, el trmino marcado hace referencia a la manera en la que el editor anota los manuscritos con especificaciones tipogrficas y otros datos sobre su presentacin. En los documentos electrnicos, el marcado es el trmino empleado para describir los cdigos, denominados tambin etiquetas, aadidos al texto electrnico que definen la estructura y el formato en el que tiene que aparecer. Puede ser utilizado, adems, para propsitos muy diferentes como son la escritura, la impresin, el intercambio, la presentacin de pantallas, etc. La gran variedad de lenguajes de marcado y su patente incompatibilidad constituyen la causa de los problemas que se plantean al intercambiar un documento entre plataformas heterogneas. Los lenguajes estndar proporcionan una manera de solventar este hecho, ya que son independientes de la aplicacin y de la plataforma hardware, empleando para marcar el documento, en la mayora de los casos, cdigo ASCII. Cuando se habla de lenguajes de marcado, es importante distinguir entre la estructura lgica y fsica del documento.

La estructura fsica: indica la apariencia del documento, ya sea en el papel o sobre la pantalla, incluyendo sus componentes fsicos, el posicionamiento de los elementos y la tipografa empleada.La estructura lgica: est formada por las partes que lo componen y por sus relaciones.

Figura 1. Estructura lgica vs estructura fsica en el documento.

La representacin de documentos es til para poder procesarlos y recuperar informacin necesaria. El objetivo de la representacin de los documentos es el de traducir los mismos a trminos del sistema, es decir la codificacin necesaria con la cual este comprenda la informacin y la represente a los usuarios que la soliciten, los documentos son alojados en un servidor el cual tiene el soporte necesario para contenerlos y ejecutarlos cuando sea requerido. Esta representacin se lleva a cabo mediante simplificaciones y generalizaciones que presentarn una vista lgica de los mismos. De manera general se podra comparar la representacin de documentos al anlisis documental, con algunas diferencias. Entre las cuales algunas representaciones son aptas para el procesamiento por parte de aplicaciones informticas segn los modelos en los que se presente. La representacin de los documentos se hace en torno a criterios temticos y analticos. Cuando se habla de la representacin de documentos HTML, se trata desde otro enfoque, ya que se revisan las estructuras del diseo, el peso del mismo por la organizacin de datos y contenidos. La informacin que se requiere para el anlisis del mismo se encuentra en el diseo maestro de la misma pgina o documento en el que se determina las caractersticas de la estructura, como; el nmero de pginas principales, el contenido de la pgina maestra, el nmero de mens existentes, las opciones dentro de cada men, las ramificaciones de cada pgina y el diseo que tendr cada contenido desde el marco principal o las divisiones que mostrar cada uno.Tipo de datos bsicos

Dada la gran variedad de formatos existentes a la hora de archivar documentos y de los problemas que se planteaban cuando se intercambiaban archivos con las consiguientes prdidas de formato y otras caractersticas, todos estos problemas se intentaron solucionar editando los textos en cdigo ASCII (American Standard Code for Information Interchange) el cdigo de 7 bits que puede representar un mximo de 128 caracteres, muchos de ellos no imprimibles. Sin embargo, con la utilizacin de este cdigo, no se poda definir el formato de un texto (por ejemplo, el uso de negrita o cursiva, o el uso de tipos de letra ms grandes para los encabezamientos), ni se podan definir otras caractersticas relativas a la posicin del texto, por lo que se intent buscar un sistema de marcas con las que se pudieran determinar stas y otras particularidades. Se acord que las marcas deberan constar de unos caracteres ASCII especialmente reservados para ello y que deberan seguirse unas reglas sintcticas especiales. As naci un lenguaje especial normalizado internacional para la formulacin de este tipo de reglas llamado Standard Generalized Markup Language o SGML. SGML no es un lenguaje en s mismo, sino un metalenguaje y de l se deriva el lenguaje HTML o lenguaje de marcas de hipertexto, y otros muchos lenguajes.Los tipos de datos bsicos se clasifican segn la forma en que se utilicen y pueden cambiar conforme el lenguaje en que se apliquen, pues su estructura de programacin es ms sencilla y no requiere de una lgica tan grande en los scripts, por ejemplo HTML, tiene una sencilla aplicacin que solo describe la formacin del documento con etiquetas las cuales solo contienen el nombre de lo que se est realizando.Actualmente los tipos de datos son aplicados en diferentes medios y plataformas, es decir, debido a la naturaleza de los datos se crean aplicaciones que son utilizadas en la web, sistemas operativos, aplicaciones mviles, calculadoras, etc. Lo que permite tener una gran variedad en el desarrollo y gran potencia de uso en las mismas ya que con los scripts, se pueden mejorar o potenciar los sistemas sin tener que agregar ms piezas de hardware. Por ejemplo, la empresa Nvidia en los sistemas grficos que utiliza, aplican ncleos de procesamiento los cuales no se aprovechaban concretamente, por lo que en el cambio y evolucin de tecnologas se desarrolla un sistema llamado CUDA el cual es una pieza de cdigo que aprovecha los ncleos del sistema grfico y los potencia mejorando el rendimiento de las vistas 3d y aumentando la velocidad de sistema.

Tipo de datos bsicos en HTML

Figura 2. Ejemplo de documento en HTML

DOCTYPE: Proporciona informacin al servidor de web anfitrin de la pgina entregando los datos necesarios para la Comunicacin entre el navegador y el servidor. (No es Obligatorio) Su forma estndar es la siguiente: HTML PUBLIC: El documento es pblico. IETF: El tipo de HTML pblico est gestionado por la Internet Engineering Task Force. DTD HTML 4.0: La versin de HTML soportada es la 4.0. EN: El idioma del documento es el ingls.META: Son cadenas de cdigos que son las primeras que leen Los buscadores. KEYWORDS: Las palabras clave son los trminos que, de manera resumida describen el contenido de una pgina web. AUTHOR: Autor de la pgina.DESCRIPCION: Ttulo que aparecer tras la bsqueda. GENERATOR: Nombre del editor que se ha generado el Documento. NOINDEX: Es cuando se desea que una pgina NO sea indexada en los motores de bsqueda.REFRESH: Refrescar la pgina cada cierto tiempo.

Separadores de Bloques (Separador de prrafos, sus atributos son left, right, center).
(Salto de lnea). (Prrafos Tabulados). (Lnea Horizontal, atributos: noshade, width, size, align). (Texto preformateado). (Centrado de bloques).

Elementos bsicos

Texto

Negrita: Existen dos etiquetas que harn que nuestro texto se convierta en negrita. La utilizacin de cualquiera de ellas es indiferente. Puedes usar la que prefieras.Ejemplo:Este palabra la vamos a poner en negrita/b> y esta otra tambinEste palabra la vamos a poner en negrita y esta otra tambinSubrayado: Si queremos que la palabra o el texto quede subrayado, deberemos rodearlo con la etiqueta y cerrarlo con su correspondiente etiqueta. O sea, /u>. As subrayaramos una frase importante: As subrayaramos una frase importanteAs subrayaramos una frase importanteCursiva: Para escribir un texto en cursiva debemos utilizar la etiqueta (y por supuesto cerrarla con la etiqueta Una tabla de prueba con celdas fusionadasMedia Ojos
RojosalturapesoMachos1.90.00340%Hembras1.70.00243%Podra representarse de una manera similar a sta en un dispositivo tty: Una tabla de muestra con celdas fusionadas /-----------------------------------------\ | | Media | Ojos | | |-------------------| rojos | | | altura | peso | | |-----------------------------------------| | Machos | 1.9 | 0.003 | 40% | |-----------------------------------------| | Hembras | 1.7 | 0.002 | 43% | \-----------------------------------------/O a sta por un agente de usuario grfico:ObjetosInsertar objetos: y La etiqueta permite insertar cualquier tipo de documentos (no solamente de texto) dentro de un documento HTML. Para poder mostrar esos archivos, el navegador suele necesitar plug-ins. Algunos tipos de documentos necesitan informacin adicional que se proporciona mediante la etiqueta . Ejemplos de insercin de objetos Insertar una pgina web Se puede insertar una pgina web en una pgina web mediante la etiqueta , como muestra el siguiente ejemplo: ERROR (no puede mostrarse el objeto) Deber crear un archivo de html llamado objeto_pagina.html para mandarlo llamar. Insertar un mapa de google Insertar un archivo PDF Se puede insertar un archivo PDF en cualquier pgina web, como muestra el siguiente ejemplo. Para insertar otro archivo PDF habra que indicar la URI del archivo mediante el atributo data (en el ejemplo, es simplemente ejemplo.pdf). ERROR (no puede mostrarse el objeto) ImgenesImgenes Atributos de IMG Los atributos de la imagen pueden ser los siguientes: ALT="Texto que aparece al situar el cursor sobre la imagen Tambin muestra este mismo texto en caso de que el navegador no cargue la imagen. ALIGN= Nos indica la posicin de la imagen respecto del texto. Despus del signo igual, pueden ir valores: TOP, MIDDLE, BOTTOM, LEFT y RIGHT. WIDTH=80, HEIGTH=100: Indican la anchura y altura de la imagen en pxeles, en este caso 80x100 pxeles. BORDER=2: Aade un borde, a modo de marco, a la imagen. En este caso de 2 pxeles. HSPACE=10, VSPACE=15: Especifican el espacio horizontal y vertical que separa la imagen del texto que la rodea, en este caso 10 pxels horizontales y 15 verticales.La propiedad border-color define el color del borde. Los valores de esta propiedad son los valores de color normales, por ejemplo, "#123456" (en notacin hexadecimal), "RGB (123,123,123)" (en notacin RGB) o "yellow" (por nombre del color).AplicacionesDefiniciones de atributoscodebase=uriEste atributo especifica el URI base para el applet. Si este atributo no se especifica, entonces su valor por defecto es el mismo URI base que el del documento actual. Los valores de este atributo slo pueden referirse a subdirectorios del directorio que contiene al documento actual.code=cdataEste atributo especifica o bien el nombre del fichero class que contiene la subclase Applet compilada del applet, o bien la ruta para obtener la clase, incluyendo al propio fichero class. Se interpreta con respecto al URI base (codebase) del applet. Deben estar presentes o biencodeo bienobject.name=cdataEste atributo especifica un nombre para la instancia del applet, lo cual hace posible que los applets de la misma pgina se encuentren (y se comuniquen) entre s.archive=lista de urisEsta lista especifica una lista de URIsseparados por comasde archivos que contienen clases y otros recursos que sern "precargados". Las clases se cargan usando una instancia de un AppletClassLoader con elcodebasedado. Los URIs relativos se interpretan con respecto al URI base (codebase) del applet. La precarga de recursos puede mejorar significativamente el rendimiento de los applets.object=cdataEste atributo indica el nombre de un recurso que contiene una representacin serializada del estado de un applet. Se interpreta relativamente al URI base (codebase) del applet. Los datos serializados contienen el nombre de la clase del applet, pero no la implementacin. El nombre de la clase se utiliza para obtener la implementacin en un archivo o fichero class.Cuando el applet es "deserializado", se invoca el mtodostart(), pero no el mtodoinit(). Los atributos que eran vlidos cuando el objeto original fue serializadonoson restaurados. Cualquier atributo que se pase a esta instanciaAPPLETestar a disposicin del applet. Los autores deberan usar esta caracterstica con extrema cautela. Un applet debera ser detenido antes de ser serializado.Deben estar presentes o biencodeo bienobject. Si se dan tantocodecomoobjecty proporcionan nombres de clases diferentes, se produce un error.width=longitudEste atributo especifica la anchura inicial del rea de presentacin del applet (sin incluir las ventanas o cuadros de dilogo que cree el applet).height=longitudEste atributo especifica la altura inicial del rea de presentacin del applet (sin incluir las ventanas o cuadros de dilogo que cree el applet).Este elemento, admitido por todos los browsers con soporte Java, permite a los diseadores incluir un applet Java en un documento HTML. Ha sidodesaprobadoen favor del elementoOBJECT.El contenido deAPPLETacta como informacin alternativa para agentes de usuario que no soporten este elemento o que estn configurados para no soportar applets. En cualquier otro caso los agentes de usuario deben ignorar el contenido.En el siguiente ejemplo, el elementoAPPLETincluye un applet Java en el documento. Al no haberse suministrado uncodebase, se supone que el applet est en el mismo directorio que el documento actual.Applet Java que dibuja burbujas animadas.Este ejemplo puede reformularse conOBJECTde esta forma:Applet Java que dibuja burbujas animadas.Se pueden proporcionar valores iniciales al applet por medio del elementoPARAM.El siguiente ejemplo de applet Java:Applet Java que reproduce un sonido de bienvenida.Puede reformularse de la siguiente manera conOBJECT:Applet Java que reproduce un sonido de bienvenida.ConclusinLos lenguajes de marcado suelen confundirse con lenguajes de programacin. Sin embargo, no son lo mismo, ya que el lenguaje de marcado no tiene funciones aritmticas o variables, como s poseen los lenguajes de programacin. Histricamente, el marcado se usaba y se usa en la industria editorial y de la comunicacin, as como entre autores, editores e impresores. Para cada lenguaje de marcado, los desarrolladores de software pueden construir una aplicacin para leer los documentos escritos en ese lenguaje. Por ejemplo: Los navegadores de Web leern los documentos HTML y Microsoft Office leer los documentos de Office. Un lenguaje de marcado o de marcas se basa en instrucciones WEB, es decir, etiquetas de programacin que podemos estructurar de manera manual o automtica mediante programas de diseo como Adobe Dreamweaver, Adobe Muse, Web Evolution x6, etc. En los cuales por tratarse de programas visuales los elementos crean las instrucciones de marcado al situar los elementos en cualquier parte del elemento que se desea crear, el desarrollo de aplicaciones web tambin se basa en lenguajes de marcas, ya que los Widgets pueden ser adquiridos desde una web exterior y ubicarla como elemento principal de un portal propio.BibliografaS/a., (2010). Tipos de datos bsicos. Recuperado el 7 de marzo de 2015,En: http://csrg.inf.utfsm.cl/~rbonvall/progra-ust-2010-1/tipos.html Teleformacin. Introduccin a los tipos de datos Recuperado el 7 de marzo de 2015, en: http://teleformacion.edu.aytolacoruna.es/PASCAL/document/tipos.htmBrending. Estructura general de un documento HTML. Recuperado el 7 de marzo de 2015, en: http://www.brendingdesigners.com.ar/html_01.htmlSAP (2012). Estructura de documento. Recuperado el 7 de marzo de 2015, en: http://help.sap.com/saphelp_40b/helpdata/es/c3/72cb9155cd11d189660000e8323c4f/content.htm Universidad de las Palmas de gran Canaria (2012). Estructura de un documento HTML. Recuperado el 7 de marzo de 2015, en: http://gias720.dis.ulpgc.es/Gias/Cursos/Tutorial_html/estruct.htmS/a. Estructuras y programacin. Elementos bsicos: texto, vnculos, listas, tablas objetos, imgenes y aplicaciones. Recuperado el 7 de marzo de 2015, en: http://www.estructurayprogramacion.com/materias/programacion-web/elementos-basicos/Barzanalla R., (2012). Informtica Lenguajes, Qu son los lenguajes de marcado o de marcas?. Recuperado el 7 de marzo de 2015, en: http://www.um.es/docencia/barzana/DIVULGACION/INFORMATICA/Q ue-son-lenguajes-marcado.html S.a. Lenguajes de Marcas, Capitulo 4. Recuperado el 7 de marzo de 2015, en: http://bibing.us.es/proyectos/abreproy/11420/fichero/VOLUMEN+1%252F4_LENGUAJES+DE+MARCAS.pdfVan R., Keith. Information Retrieval. Rutterworths, London, 1979. Segundo captulo. Recuperado el 7 de marzo de 2015, en: http://www.dcs.gla.ac.uk/Keith/Chapter.2/Ch.2.html7