XMLParser编码问题

时间:2012-09-22 09:25:38

标签: android xml utf-8

public XMLParser(InputStream is) {
    try {
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        DocumentBuilder db;
        db = dbf.newDocumentBuilder();
        Document doc = db.parse(is);
        node = doc.getDocumentElement();
    } catch (Exception e) {
        DebugLog.log(e);
    }
}

inputStream包含如下内容:“嘿,这是一个& uuml;字符。” 角色'& uuml;'是'ü';

当读取节点的内容System.out.println(node.getTextContent())时,我收到“嘿,这是一个角色。” &安培; uuml;被削减了。

2 个答案:

答案 0 :(得分:0)

答案 1 :(得分:0)

问题是XML实体和HTML实体。 我请求一个返回HTML实体数据的网页。 我必须将HTML实体转换为XML实体并且它有效!

Check this answer for some code