我正在使用SAX
解析从webservice获取的XML。
其中一个字段是链接,如下所示
<link_site>
http://www.ownhosting.com/webservice_332.asp?id_user=21395&id_parent=33943
</link_site>
我必须获取此链接并保存,但保存的方式如下:id_parent=33943
。
Parser片段:
//inside method startElement
else if(localName.equals("link_site")){
this.in_link=true;
}
...
//inside method endElement
else if(localName.equals("link_site"){
this.in_link=false;
}
然后,我得到了内容
else if(this.in_link){
xmlparsing.setOrderLink(count, Html.fromHtml(new String(ch, start, length)).toString());
}//I get it and put in a HashMap<Integer,String>
我知道这个问题是由特殊字符编码引起的。
我该怎么办?
答案 0 :(得分:1)
&安培;使解析器拆分行并对characters()方法进行多次调用。你需要整理这些块。像这样的东西
SAXParserFactory.newInstance().newSAXParser()
.parse(new File("1.xml"), new DefaultHandler() {
String url;
String element;
@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
element = qName;
url = "";
}
@Override
public void characters(char[] ch, int start, int length) throws SAXException {
if (element.equals("link_site")) {
url += new String(ch, start, length);
}
}
@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
if (element.equals("link_site")) {
System.out.println(url.trim());
element = "";
}
}
});
打印
http://www.ownhosting.com/webservice_332.asp?id_user=21395&id_parent=33943