Java SAX Parser中的变音符号

时间:2009-09-23 16:08:41

标签: java eclipse xml-parsing sax

我目前在收到的XML文档中遇到德语变音符号值的问题。

显示/保存值为“Ô而不是“ü”。

XML编码设置为 UTF-8 ,它应该能够显示变音符号。

此外,我找不到在SAX解析器上设置语言环境的任何选项。

还有其他方法可以让值保存正确吗?

btw:我使用eclipse作为IDE。

非常感谢所有帮助!

提前致谢!

2 个答案:

答案 0 :(得分:2)

XML以UTF-8编码,但您使用ISO-8859-1对其进行解码。

尝试使用InputStream和其他面向XML的“二进制”API。在解析XML之前,请避免使用Reader或尝试从byte[]转换为String。与解析器相比,你更容易弄乱字符编码。

答案 1 :(得分:0)

在XML声明中将XML编码设置为UTF-8是唯一的事情,但另一件事是XML文档的物理编码,即,您可以拥有一个说<?xml version="1.0" encoding="utf-8"?>的XML文件,但文件本身可能仍然是ANSI编码(或其他)。