解析xml特殊字符问题

时间:2014-01-30 10:06:47

标签: java android xml-parsing htmlspecialchars

我正在使用SAX解析从webservice获取的XML。

其中一个字段是链接,如下所示

<link_site>
   http://www.ownhosting.com/webservice_332.asp?id_user=21395&amp;id_parent=33943
</link_site>

我必须获取此链接并保存,但保存的方式如下:id_parent=33943

Parser片段:

//inside method startElement
else if(localName.equals("link_site")){
    this.in_link=true;
}
...
//inside method endElement
else if(localName.equals("link_site"){
     this.in_link=false;
}

然后,我得到了内容

else if(this.in_link){
    xmlparsing.setOrderLink(count, Html.fromHtml(new String(ch, start, length)).toString());
}//I get it and put in a HashMap<Integer,String>

我知道这个问题是由特殊字符编码引起的。

我该怎么办?

1 个答案:

答案 0 :(得分:1)

&安培;使解析器拆分行并对characters()方法进行多次调用。你需要整理这些块。像这样的东西

    SAXParserFactory.newInstance().newSAXParser()
            .parse(new File("1.xml"), new DefaultHandler() {
                String url;
                String element;

                @Override
                public void startElement(String uri, String localName, String qName,
                        Attributes attributes) throws SAXException {
                    element = qName;
                    url = "";
                }

                @Override
                public void characters(char[] ch, int start, int length) throws SAXException {
                    if (element.equals("link_site")) {
                        url += new String(ch, start, length); 
                    }
                }

                @Override
                public void endElement(String uri, String localName, String qName)
                        throws SAXException {
                    if (element.equals("link_site")) {
                        System.out.println(url.trim());
                        element = "";
                    }
                }
            });

打印

http://www.ownhosting.com/webservice_332.asp?id_user=21395&id_parent=33943