我在java中使用xml解析时遇到了一些问题。在文本中找到的引用在不同的浏览器文本编码中是这样的:
iso-8859-1 | utf-8
(“ | “
†| ”
’ | ’
我试图在xml字符串中解析两者以显示在我的Android应用程序中。但是,这两个符号都无法成功解析。
我被迫替换“to”和“to”(并在php中对它们进行编码) )在解析文本之前。
我可以知道它为什么吗? XML解析器不允许任何特殊符号?
答案 0 :(得分:0)
大多数XML解析器应该允许您指定输入所在的编码。如果您正在使用XMLPullParser,您可以像这样更改它:
parser.setInput(this.getInputStream(),"UTF-8");
如果您正在将SAX与InputStream一起使用,请更改InputStream的编码,如下所示:
is.setEncoding("UTF-8");