etiquetas canónicas y UTF8
-
27-09-2019 - |
Pregunta
¿Las siguientes 2 etiquetas de enlaces canónicos ser vistos por las arañas como apuntar a la misma URL?
<link rel="canonical" href="http://www.example.com/ŷ" />
- codificada
<link rel="canonical" href="http://www.example.com/ŷ" />
- sin codificar
Solución
ŷ
es una entidad HTML que representa el carácter Unicode con el punto de código 375 en notación decimal. En hexadecimal que sería 0x177 por lo que estamos hablando de U + 0177, que es ŷ
.
- http://en.wikipedia.org/wiki/List_of_XML_and_HTML_character_entity_references
- http://inamidst.com/stuff/unidata/
- http://www.fileformat.info/info/unicode/ char / 0177 / index.htm
Esto significa que ambas URL son exactamente lo mismo si:
- en que se muestran en el contexto de un documento HTML.
- El documento declara un conjunto de caracteres adecuado que tales soportes símbolo y el editor se utilizan para escribirla inserta el código correcto.
Si la pantalla del navegador Y en ambos casos, lo más probable es que el conjunto de caracteres es correcta, pero usted debe asegurarse de que es.
Otros consejos
No es 100% seguro, pero creo que ambos apuntarían a la misma URL. Pero hay que tener en cuenta, que mirando a las normas W3, que a menudo sugieren vínculos a codificar.
si se comunica el código HTML como UTF-8 la url es visto como el mismo.
A pesar de que se puede esperar que funcione en los navegadores modernos, http://www.example.com/ŷ
es una URL no válida .
Siempre se debe codificar caracteres Unicode ciento.