我们的网站刚刚推出了新版本,现在网页上的网址都包含Unicode。我看到Rails在渲染锚标签时有正确的url转义这些UTF-8字符。
/regions/%E4%B8%AD%E5%BD%B0%E6%8A%95/
但是,我仍然看到大量流量错误编码的网址:
/regions/%A4%A4%B9%FC%A7%EB/
显然这是相同的地址,但是以UTF-8以外的其他方式编码,然后网址被转义。
问题
我想知道是否有任何旧的浏览器,它将采用正确的转义网址,unescape它获取UTF-8,用其他编码编码,然后在请求服务器时url-escape它?
否则我不知道如何解释这些流量。
答案 0 :(得分:0)
我已经在Internet Explorer 6和7中进行了测试。我还测试了“始终将URL作为UTF-8发送”选项。这些组合都没有导致不正确的编码请求。
我猜这是由一些处理解码而不是编码的网络爬虫。