蜘蛛会将以下2个规范链接标记视为指向同一个网址吗?
<link rel="canonical" href="http://www.example.com/ŷ" />
- 已编码
<link rel="canonical" href="http://www.example.com/ŷ" />
- 未编码
答案 0 :(得分:3)
ŷ
是一个HTML实体,表示带有十进制表示法代码点375的Unicode字符。在十六进制中,它是0x177,所以我们谈论的是U + 0177 ŷ
。
这意味着如果符合以下条件,两个网址都完全相同:
如果浏览器在两种情况下都显示it,那么字符集可能是正确的,但你应该确定它是。
答案 1 :(得分:1)
不是100%肯定,但我认为他们都会指向相同的网址。但请记住,在考虑W3标准时,他们通常会建议编码链接。
答案 2 :(得分:1)
如果您将HTML作为UTF-8传达,则网址被视为相同。
答案 3 :(得分:1)
即使您可以在现代浏览器中使用它,http://www.example.com/ŷ
is an invalid URL。
您应始终对unicode字符进行百分比编码。