如何在Javascript中使用重音字符对URL进行编码?

时间:2011-03-14 15:35:36

标签: internet-explorer url encoding

我在IE中遇到了一个奇怪的问题,如果我在URL中传递了它不起作用的情况,那么它似乎对其他浏览器非常有效。

在IE中,URL显示为:

... / search.aspx?关键字= SC%C3%83%C2%a9nario

在FireFox中,URL显示为:

... / search.aspx?关键字= SC%C3%A9nario

在IE中,URL断开,Firefox工作正常,我是否必须在IE中进行URL解码才能解决这个问题?

1 个答案:

答案 0 :(得分:3)

虽然你没有说你如何“通过”字符串,但我可以告诉你发生了什么。

字符é具有代码点E9。在UTF-8中,它被编码为两个字节:C3 A9。因此,在URL中显示“scénario”的正确方法是

sc%C3%A9nario

现在,如果您使用此字符串并查看每个字节并假设它们是字符,并且第二次第二次执行UTF-8编码会发生什么?会发生什么是

  • s - >小号
  • c - > ç
  • %C3将被解释为带有代码点C3的字符,即Ã,其中UTF-8是C3 83。
  • %A9将被解释为具有代码点A9的char,即©,其在UTF-8中为C2 A9。
  • n - > Ñ

这与您在IE中看到的完全一致。

现在我无法确定这是怎么发生的,因为问题背景不够,但很清楚的是,不知何故,字符串“scénario”被编码成UTF-8字节字符串并且然后它再次编码基于奇怪的假设,即第一个编码产生了Windows-1252或Latin-1编码的字符串。

你需要研究你的字符串是如何“编码两次的。”