-
27-09-2019 - |
题
以下 2 个规范链接标签会被蜘蛛视为指向同一个 URL 吗?
<link rel="canonical" href="http://www.example.com/ŷ" />
- 编码的
<link rel="canonical" href="http://www.example.com/ŷ" />
- 未编码的
解决方案
ŷ
是一个 HTML 实体,以十进制表示法表示代码点为 375 的 Unicode 字符。在十六进制中它是 0x177,所以我们谈论的是 U+0177,它是 ŷ
.
- http://en.wikipedia.org/wiki/List_of_XML_and_HTML_character_entity_references
- http://inamid.com/stuff/unidata/
- http://www.fileformat.info/info/unicode/char/0177/index.htm
这意味着两个 URL 完全相同,如果:
- 它们显示在 HTML 文档的上下文中。
- 该文档声明了支持此类符号的正确字符集,并且用于键入它的编辑器插入了正确的代码。
如果浏览器在这两种情况下都显示 ŷ,则字符集可能是正确的,但您应该确保它是正确的。
其他提示
不是100%肯定,但我认为他们都将指向同一个URL。但请记住,看着W3的标准,他们往往建议的链接进行编码。
如果你传达你的HTML作为UTF-8的URL被看作是相同的。
尽管你可以指望它在现代浏览器,http://www.example.com/ŷ
工作是无效的网址
您应该总是百分比编码的Unicode字符。
不隶属于 StackOverflow