将编码和字符集更改为UTF-8

时间:2014-02-26 14:32:41

标签: utf-8 http-headers

我们需要我们的Web应用程序来处理其他字符 - 因此需要从ISO-8859-1转换为UTF-8。所以我的q是UTF-8向后兼容ISO-8859-1?

我做了以下更改,现在可以处理所有字符,但是要确保没有边缘情况我不知道。

  1. 更改内容类型: 来自“text / html; charset = ISO-8859-1” to“text / html; charset = UTF-8”

  2. Tomcat Connector URIEncoding from ISO-8859-1 to UTF-8

  3. 由于

1 个答案:

答案 0 :(得分:1)

  

是UTF-8向后兼容ISO-8859-1?

Unicode是ISO-8859-1中包含的代码点的超集,因此所有“字符”都可以用UTF-8表示,但它们映射到字节值的方式是不同的。编码值之间存在重叠但不是100%。

在提交内容或处理表单提交方面,您不太可能遇到很多问题。

这可能意味着URL处理的重大变化。例如,对于参数值naïve,将存在两种不兼容的形式:

  • http://example.com/foo?p=na%EFve
  • http://example.com/foo?p=na%C3%AFve

如果外部应用程序依赖于旧表单,则这可能只是一个问题。