Canonical balises et UTF8
-
27-09-2019 - |
Question
2 Est-ce que les balises de liens canoniques suivants être vu par les araignées comme pointant vers la même URL?
<link rel="canonical" href="http://www.example.com/ŷ" />
- encodée
<link rel="canonical" href="http://www.example.com/ŷ" />
- unencoded
La solution
ŷ
est une entité HTML qui représente le caractère Unicode avec le point de code 375 en notation décimale. En hexadécimal, il serait 0x177 donc nous parlons de U + 0177 qui est ŷ
.
- http://en.wikipedia.org/wiki/List_of_XML_and_HTML_character_entity_references
- http://inamidst.com/stuff/unidata/
- http://www.fileformat.info/info/unicode/ char / 0177 / index.htm
Cela signifie que les deux URL sont exactement les mêmes si:
- Ils sont affichés dans le contexte d'un document HTML.
- Le document déclare un ensemble approprié de caractères supports tels symbole et l'éditeur que vous avez utilisé pour taper inséré le bon code.
Si le navigateur affiche ý dans les deux cas, il est probable que le jeu de caractères est correct, mais vous devez vous assurer qu'il est.
Autres conseils
pas 100% sûr, mais je pense que les deux se pointer vers la même URL. Mais gardez à l'esprit que regardant les normes W3, ils suggèrent souvent des liens à coder.
si vous communiquez votre code HTML UTF-8 l'URL est considéré comme le même.
Même si vous pouvez vous attendre à travailler dans les navigateurs modernes, http://www.example.com/ŷ
une URL non valide .
Vous devriez toujours pour cent encode caractères unicode.