Канонические теги и UTF8
-
27-09-2019 - |
Вопрос
Будут ли следующие 2 теги Canonical Link Spiders, как указывая на тот же URL?
<link rel="canonical" href="http://www.example.com/ŷ" />
- закодирован
<link rel="canonical" href="http://www.example.com/ŷ" />
- бездействующий
Решение
ŷ
Это объект HTML, который представляет символ Unicode с кодовой точкой 375 в десятичной записи. В шестнадцатеричном, это было бы 0x177, поэтому мы говорим о U + 0177, который ŷ
.
- http://en.wikipedia.org/wiki/list_of_xml_and_html_character_entity_references.
- http://inamidst.com/stuff/unidata/
- http://www.fileformat.info/info/unicode/char/0177/index.htm.
Это означает, что оба URL были точно так же, если:
- Они отображаются в контексте HTML-документа.
- Документ объявляет надлежащий набор символов, который поддерживает такой символ, и редактор, который вы использовали для того, чтобы вставить его вставил правильный код.
Если браузер отображает ŷ В обоих случаях, вероятно, что набор символов правильный, но вы должны убедиться, что это так.
Другие советы
Не на 100% уверен, но я думаю, что они оба будут указывать на один и тот же URL. Но имейте в виду, что смотрите на стандарты W3, они часто предлагают кодировку ссылок.
Если вы сообщите свой HTML как UTF-8, URL-адрес считается таким же.
Даже если вы можете ожидать, что это работать в современных браузерах, http://www.example.com/ŷ
неверный URL.
Вы всегда должны процентов кодировать символы Unicode.