HTML: ¿migrar a un nuevo juego de caracteres?
Articles,  Blog

HTML: ¿migrar a un nuevo juego de caracteres?


hola soy sergio luján mora profesor de informática de la universidad de alicante y en este vídeo que forma parte del curso introducción al desarrollo web te voy a hablar sobre la migración de un sitio web a un nuevo juego de caracteres antes de empezar me gustaría recordarte algunos de los sitios web en los que puedes encontrar más información sobre mí y sobre mi trabajo y dos formas de contactar conmigo a través de mi correo electrónico sergio luján uah.es y a través de mi cuenta en twitter sergio luján mora antes de ver este vídeo te recomiendo que veas los vídeos html juego de caracteres y html el juego de caracteres y los editores de texto que te ayudarán a entender mejor qué es el juego de caracteres en estos dos vídeos el consejo que doy es que lo mejor es usar el juego de caracteres ute f8 symbol ya que es la solución a todos los problemas que pueden aparecer con el juego de caracteres y permite mezclar en un mismo documento textos en cualquier idioma es decir te permite mezclar caracteres de cualquier alfabeto pero qué pasa si ya tenemos un sitio web con otro juego de caracteres debemos migrar el sitio web al juego de caracteres etc 8 sin bom vamos a analizarlo con un caso real la situación que me ha planteado un amigo que es alumno de este curso mi amigo es biólogo y empezó a hacer páginas web en el año 1996 sus primeras páginas web las hacía con el programa microsoft from page desde hace varios años mi amigo mantiene un sitio web sobre rutas de montaña de senderismo muy popular con un buen número de visitas mi amigo me mandó el siguiente mensaje al ver uno de mis vídeos una duda técnica después de ver el último vídeo que has publicado sobre codificación etc 8 sin bom me dado cuenta de dos cosas una de que eso existe dos que mi editor de html dreamweaver 8 las nuevas páginas están configuradas como tipo de documento de td xhtml 1.0 transicional y codificación encoding europeo occidental sobre la codificación no hay problema para ponerla en f8 symbol pero con respecto al tipo de documento cuál de las siguientes posibilidades que me ofrece debo escoger html 401 transición al html 401 streak xhtml 10 transicional xhtml 10 streak o xhtml mobile 1.0 y continuar esto es más que nada para hacer la práctica del curso aunque también me bajaré notepad plus plus a ver si me acostumbro a parte de eso ya me he dado cuenta de que todo lo que he escrito más o menos desde 2004 está en xhtml 1.0 transición al europeo occidental supongo que adam world algún día tendré que validar y limpiar todo ese código es tan simple como guardar las páginas con la nueva codificación o se debe hacer una revisión completa y manual para detectar errores tampoco estoy pensando en revisar todo lo viejo sino de aprovechar lo que funcione bien se entiende mi amigo usa dreamweaver 8 cuando se crea un nuevo documento aparece un asistente que permite elegir la categoría de documento que se quiere crear cuando se elige crear una página web se tiene que elegir el tipo de documento el dt de que se quiere aplicar el dt de el doctor indica la versión de html que se usa además en las propiedades de un documento también se puede definir la codificación elenco dyn del documento el juego de caracteres al final todo esto se traduce en dos cosas en el código html en el doc type en el que se indica la versión de html y en la etiqueta meta chart set en la que se indica la codificación un juego de caracteres mi amigo usa el juego de caracteres y so 8859 uno también llamado latín uno que dreamweaver llama europa occidental porque es el mejor juego de caracteres para los idiomas de europa occidental incluido el español no hay ningún problema en usar este juego de caracteres pero mi amigo hace algo que no es necesario mi amigo escribe los caracteres que no pertenecen al juego de caracteres así como las vocales acentuadas y la ñ como referencias de carácter con nombre en el vídeo html tres errores típicos ya expliqué que cuando se escribe el código así a veces es muy difícil de leer este código está mal no no está mal pero si se emplea el juego de caracteres adecuado y mi amigo está utilizando eso 8859 uno que es un juego de caracteres adecuado entonces escribir el texto así es totalmente inútil porque no es necesario y no aporta ninguna ventaja volviendo al correo de mi amigo le contesté lo siguiente este consejo utilizar f8 symbol es para la creación de las páginas nuevas en tu caso yo te aconsejo que sigas como hasta ahora no te vale la pena realizar una emigración que ahora mismo no tienes ningún problema no hay ningún problema para trabajar con europeo occidental es 88 59 1 o latin 1 si no tienes que incluir idiomas con otros alfabetos o no te vas a conectar con otros sistemas que tengan otra codificación mi amigo podría tener problemas si se conecta a una base de datos y no elige el juego de caracteres adecuado o si utiliza un servicio web que le devuelve los datos en un juego de caracteres distinto al suyo pero en principio no tiene planes de hacer nada de esto y continuaba con mi respuesta digamos que usted f8 sin bom es la solución fácil para todo y que te asegura que no tendrás problemas en el futuro pero usar europa occidental es una buena opción es más es lo mejor porque ahorras espacio que significa ahorrar espacio vamos a hacer una prueba me bajó el fichero html de la página principal de la universidad de alicante y con el notepad plus lo convierto del formato original f8 symbol ice 88 59 1 o latín 1 si comparamos los tamaños de los ficheros comprobamos que la versión original de la página web que está en formato de 8 sin bom la que podemos ver a la izquierda ocupa 360 baix más que la versión en formato latino uno que aparece a la derecha esto se debe a que ciertos caracteres las vocales acentuadas o la eñe ocupan dos bytes en vez de uno y por último le decía a mi amigo respecto al doc type sí que te aconsejo que utilices docta y html para html5 en tus nuevas páginas si no sigue con el x html 1.0 transicional porque él aconsejó esto porque es muy probable que en un plazo corto de tiempo le interese aprovechar algunas de las nuevas características de html5 y para terminar cómo podemos convertir fácilmente un conjunto de páginas de una codificación a otra es decir como puedo migrar un sitio web de una codificación a otra pues en windows no es fácil en linux y mac os x es fácil desde la línea de comandos por un lado tenemos el comando file que nos permite conocer el tipo y la codificación de un fichero y por otro lado tenemos y con ub que convierte la codificación de un fichero de una codificación a otra en windows el único método que conozco es utilizar un editor de textos como por ejemplo pues el nobody plus y convertir fichero a fichero en nuestro sitio web por último en el sitio web del w3c dedicado a la internacionalización podemos encontrar mucha información sobre el juego de caracteres te recomiendo la lectura de los artículos codificación de caracteres conceptos básicos y selección y aplicación de codificación de caracteres espero que estos vídeos te ayuden a entender qué es el juego de caracteres y lo sepas utilizar un poco mejor recuerda que este vídeo forma parte del curso introducción al desarrollo web que está disponible en la dirección y des web punto es muchas gracias por tu atención

2 Comments

  • iDESWEB UA

    Mi amigo me comenta los siguiente sobre las referencias de carácter con nombre: "Sobre los caracteres especiales para los acentos y demás que aparecen en mi código, los escribe directamente Dreamweaver".

Leave a Reply

Your email address will not be published. Required fields are marked *