Tags canoniche e UTF8
-
27-09-2019 - |
Domanda
Sarebbe il seguito 2 link canonico tag di essere vista da un ragno come punti allo stesso URL?
<link rel="canonical" href="http://www.example.com/ŷ" />
- codificato
<link rel="canonical" href="http://www.example.com/ŷ" />
- non codificati
Soluzione
ŷ
è un'entità HTML che rappresenta il carattere Unicode codice punto di 375 in notazione decimale.In esadecimale sarebbe 0x177 quindi stiamo parlando di U+0177 che è ŷ
.
- http://en.wikipedia.org/wiki/List_of_XML_and_HTML_character_entity_references
- http://inamidst.com/stuff/unidata/
- http://www.fileformat.info/info/unicode/char/0177/index.htm
Ciò significa che entrambi gli Url sono esattamente la stessa se:
- Vengono visualizzate nel contesto di un documento HTML.
- Il documento dichiara un set di caratteri corretto che supporta tale simbolo e l'editor utilizzato per tipo è inserito il codice corretto.
Se il browser visualizza ŷ in entrambi i casi è probabile che il set di caratteri è corretto, ma è necessario assicurarsi che è.
Altri suggerimenti
Non sono sicuro al 100%, ma penso che sia la stessa URL.Ma tenere a mente, che guardando W3 norme, che spesso suggeriscono che i collegamenti siano codificati.
se si comunica il tuo codice HTML come UTF-8 l'url è visto come la stessa.
Anche se si può aspettare a farla funzionare in tutti i browser moderni, http://www.example.com/ŷ
è un URL non valido.
Si dovrebbe sempre percento codifica dei caratteri unicode.