HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y...

36
HTML Introducción al desarrollo web http://idesweb.es/ HTML: ¿migrar a un nuevo juego de caracteres? Sergio Luján Mora Departamento de Lenguajes y Sistemas Informáticos Universidad de Alicante (España) IDW-HTML-JC-03

Transcript of HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y...

Page 1: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

HTML: ¿migrar a un nuevo juego de caracteres?

Sergio Luján Mora

Departamento de Lenguajes y Sistemas Informáticos

Universidad de Alicante (España)

IDW-HTML-JC-03

Page 2: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Contacto • http://gplsi.dlsi.ua.es/~slujan/

• http://accesibilidadenlaweb.blogspot.com.es/

• http://accesibilidadweb.dlsi.ua.es/

• http://desarrolloweb.dlsi.ua.es/

• http://www.youtube.com/user/sergiolujanmora

[email protected]

• @sergiolujanmora

Page 3: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/ http://youtu.be/_MwDNB3jOx0

Page 4: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/ http://youtu.be/4vF41rQU_4Y

Page 5: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

UTF-8 sin BOM

Page 6: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

¿Qué pasa si ya tenemos un sitio web

con otro juego de caracteres?

Page 7: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Biólogo 1996

Microsoft Frontpage

Page 8: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/ http://youtu.be/4vF41rQU_4Y

Page 9: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Una duda técnica. Después de ver el último vídeo que has publicado sobre codificación UTF-8 sin BOM, me he dado cuenta de dos cosas. Una, de que eso existe. Dos, que en mi editor de HTML (Dreamveawer 8) las nuevas páginas están configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema para ponerla en UTF-8 sin BOM, pero con respecto al tipo de documento, ¿cuál de las siguientes posibilidades que me ofrece debo escoger?: HTML 4.01 Transitional, HTML 4.01 Strict, XHTML 1.0 Transitional, XHTML 1.0 Strict, XHTML Mobile 1.0.

Page 10: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Esto es más que nada para hacer la práctica del curso, aunque también me bajaré Notepad++ a ver si me acostumbro. Aparte de eso, ya me he dado cuenta de que todo lo que he escrito más o menos desde 2004 está en XHTML 1.0 Transitional y europeo occidental. Supongo que algún día tendré que validar y limpiar todo ese código. ¿Es tan simple como guardar las páginas con la nueva codificación, o se debe hacer una revisión completa y manual para detectar errores? Tampoco estoy pensando en revisar todo lo viejo, sino de aprovechar lo que funcione bien, se entiende.

Page 11: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Page 12: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Page 13: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Page 14: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

ISO-8859-1 Latin1

Page 15: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Page 16: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Page 17: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Referencias de carácter con nombre

Page 18: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/ http://youtu.be/rDX42iLrUEg

Page 19: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/ ISO-8859-1

Latin1

Page 20: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Este consejo (utilizar UTF-8 sin BOM) es para la creación de las páginas nuevas. En tu caso, yo te aconsejo que sigas como hasta ahora, no te vale la pena realizar una migración si ahora mismo no tienes ningún problema. No hay ningún problema para trabajar con Europeo Occidental (ISO-8859-1/Latin1) si no tienes que incluir idiomas con otros alfabetos o no te vas a conectar con otro sistema que tenga otra codificación.

Page 21: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

HTML

CSS JS

PHP

TXT

BD

SERVICIO WEB

Page 22: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Digamos que "UTF-8 sin BOM" es la solución fácil para todo y que te asegura que no tendrás problemas en el futuro, pero usar Europa Occidental es una buena opción, es más, es lo mejor porque ahorras espacio.

Page 23: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Page 24: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Page 25: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Page 26: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Respecto al DOCTYPE, sí que te aconsejo que utilices <!DOCTYPE html>, para HTML5, en tus nuevas páginas. Si no, sigue con el XHTML 1.0 Transitional.

Page 27: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Page 28: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

file

iconv

Page 29: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Page 30: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Page 31: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

http://www.w3.org/International/articlelist

Page 32: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

http://www.w3.org/International/articles/definitions-characters/

Page 34: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

Juego de caracteres

Page 35: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

UTF-8 Unicode

ISO-8859-1

Latin-1 Cotejamiento

ASCII

UTF-8 sin BOM

Mapa de caracteres

ANSI

Page 36: HTML: Juego de caracteres · configuradas como tipo de documento (DTD: XHTML 1.0 Transitional) y codificación (encoding: europeo occidental). Sobre la codificación, no hay problema

HTM

L Introducción al desarrollo web http://idesweb.es/

http://idesweb.es/

[email protected] @idesweb