解析使用UTF-8编码的XML文件时出现无效的令牌错误

时间:2010-04-22 07:20:34

标签: xml-parsing

使用UTF-8编码解析XML文件时出现无效的令牌错误。

当遇到扩展的ASCII字符“â”,“â”,“â”时,会出现此错误。

当我将编码从UTF-8更改为ISO-8859-1时,解析成功。但我的应用程序应该支持UTF-8,ASCII和扩展的ASCII字符。我该怎么做?

欢迎任何想法。

先感谢您的时间和解决方案。

1 个答案:

答案 0 :(得分:1)

通过设置XML声明的encoding属性来告诉解析器latin-1文件是UTF-8将导致类似于您报告的错误。

如果'{3}}编码文件中出现'â'字符(U + 00E2),则该字符将作为双字节序列在该文件中编码。因此,如果您在更改编码时没有更改文件中的字节,则不会更改文件的编码,只会告诉解析器非UTF-8文件是UTF-8。