在Java中解析XML的有效方法

时间:2011-09-07 06:06:38

标签: java xml xml-parsing

我必须解析具有以下结构的XML文件:

<root>
    <object_1>
        <pro1> abc </pro1>
        <pro2> pqr </pro2>
        <pro3> xyz </pro3>

        <children>
            <object_a>
                <pro1> abc </pro1>
                <pro2> pqr </pro2>
                <pro3> xyz </pro3>

                <children>
                    .
                    .
                    .
                </children>
            </object_a>
        </children>     
    </object_1>
    <object_2> 
    .
    . 
    .
    </object_n>
</root>

目标是解析这个多级嵌套。 Java中定义了一些类。

Class Object_1
Class Object_2
.
.
.
Class Object_N

具有各自的属性。

以下代码对我有用,但这不是最好的做事方式。

File file = new File(fileName);
DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
Document doc = dBuilder.parse(file);
doc.getDocumentElement().normalize();

if(doc ==null) return;

Node node = doc.getFirstChild();

NodeList lst = node.getChildNodes();
Node children = null ; 

int len = lst.getLength();
for(int index=0;index<len;index++)
{
    Node child = lst.item(index);
    String name = child.getNodeName();
    if(name=="Name")
        name = child.getNodeValue();
    else if(name=="Comment")
        comment = child.getNodeValue());
    else if(name=="children")
        children = child;
    }

    if(children==null) return; 

    lst = children.getChildNodes();
    len = lst.getLength();
    Class<?> obj=null;
    AbsModel model = null;
    for(int index=0;index<len;index++)
    {
        Node childNode = lst.item(index);
        String modelName = childNode.getNodeName();
        try {
            obj = Class.forName(modelName);
        } catch (ClassNotFoundException e) {
            e.printStackTrace();
        }
        if(obj!=null)
            model = (AbsModel) obj.newInstance();
        else
            model = new GenericModel();

        model.restoreDefaultPropFromXML(childNode);
        addChild(model);
    }
}

是否有更好的方法来解析此XML。

3 个答案:

答案 0 :(得分:9)

考虑使用JAXB,它是自版本6以来Java的一部分。您应该能够将您的XML文件解析(“解组”)到您自己的类中,而几乎没有代码,只需添加一些注释来解释在对象结构和XML结构之间进行映射。

答案 1 :(得分:0)

StAX JAXB 几乎总是可行的。

如果XML真的是动态的(比如属性指定属性名称),即<prop name="property" value="" />那么你只需要使用 StAX 或者使用 JAXB 将它映射到(具有名称和值属性的POJO)和后期处理。

我个人认为最好将StAX和JAXB结合起来。我解析我想要的元素,然后使用JAXB将元素转换为POJO。

另见

答案 2 :(得分:0)

虽然JAXB可能是最好的选择,但我也想提一下jOOX ,它提供了类似JQuery的API,并且使得处理XML文档非常愉快。