我正在使用SAX Parser解析像这样的xml:
<items>
<item>
<id>1000</id>
<title>Rock Music</title>
</item>
<item>
<id>1011</id>
<title>R&B Music</title>
</item>
......................
当我解析时,我可以得到:
1000 Rock Music
1011
但不是包含特殊字符的文字,而不是......之后就停止了。我没问题有空格,问题只是特殊的字符。 我试过了:
InputSource is = new InputSource(sourceUrl.openStream());
is.setEncoding("ISO-8859-1"); //also "UTF-8" and other encoding but didn't work.
如何提取和显示包含“&amp;”的文字假设我没有编辑xml的权限?(我听说如果你在编写xml时编写&
它就可以了!)
答案 0 :(得分:1)
在SAX看到之前,您可以尝试将输入包装成FilterInputStream
和HTML-encode文本。
但是,实际上,您应该与发送此数据的人交谈,并让他们修复损坏的XML。