使用SAX XML Parser的问题

时间:2011-09-04 17:53:21

标签: java xml saxparser

我正在使用SAX Parser进行XML解析。问题出在以下XML代码中:

<description>
Designer:Paul Smith Color:Plain Black Fabric/Composition:100% cotton        Weave/Pattern:pinpoint Sleeve:Long-sleeved Fit:Classic Front style:Placket front Back style:Side pleat back Collar:Classic/straight collar Button:Pearlescent front button Pocket:rounded chest pocket Hem:Rounded hem
</description>

我明白了:

Designer:Paul Smith
Color:Plain Black 

缺少其他部分。对于其他一些行也会发生同样的事情。有人可以告诉我我的方法有什么问题吗?

我的代码如下:

解析器代码:

try {
        /** Handling XML */
        SAXParserFactory spf = SAXParserFactory.newInstance();
        SAXParser sp = spf.newSAXParser();
        XMLReader xr = sp.getXMLReader();

        /** Send URL to parse XML Tags */
        URL sourceUrl = new URL(
        "http://50.19.125.224/Demo/VeryGoodSex_and_the_City_S6E6.xml");

        /** Create handler to handle XML Tags ( extends DefaultHandler ) */
        MyXMLHandler myXMLHandler = new MyXMLHandler();
        xr.setContentHandler((ContentHandler) myXMLHandler);
        xr.parse(new InputSource(sourceUrl.openStream()));

    } catch (Exception e) {
        System.out.println("XML Pasing Excpetion = " + e);
    }

用于保存XML解析信息的对象:

public class ParserObject {

String name=null;
String description=null;
String bitly=null; //single
String productLink=null;//single
String productPrice=null;//single
Vector<String> price=new Vector<String>();
}

处理程序类:

public void endElement(String uri, String localName, String qName)
throws SAXException {


    currentElement = false;


    if (qName.equalsIgnoreCase("title"))
    {
        xmlDataObject[index].name=currentValue;
    }

    else if (qName.equalsIgnoreCase("artist"))
    {
        xmlDataObject[index].artist=currentValue;
    } 

}


public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {


    currentElement = true;

    if (qName.equalsIgnoreCase("allinfo"))
    {
        System.out.println("started");
    }

    else if (qName.equalsIgnoreCase("tags"))
    {
        insideTag=1;
    } 

}

public void characters(char[] ch, int start, int length)
throws SAXException {

    if (currentElement) {
        currentValue = new String(ch, start, length);
        currentElement = false;
    }

}

2 个答案:

答案 0 :(得分:2)

你必须连接解析器给你的字符,直到它调用endElement

尝试从currentElement = false;处理程序和

中删除characters
currentValue = currentValue + new String(ch, start, length);

使用空字符串初始化currentValue或在上面的表达式中处理null值。

答案 1 :(得分:1)

我认为角色会同时阅读一些但不是所有角色。 因此,你只能获得第一个“块”。 尝试在单独的行上打印每个字符块,作为调试(在if之前)。