JAXP和StAX - DOM节点表示为Document

时间:2015-06-29 19:38:59

标签: java xml dom stax jaxp

我想阅读一个可能很大的XML文件。为了提高内存效率和易于处理,我想使用StAX和DOM的混合,如here所述。

我的输入如下(OSM

<?xml version="1.0" encoding="UTF-8"?>
<osm version="0.6" generator="CGImap 0.0.2">
 <bounds minlat="54.0889580" minlon="12.2487570" maxlat="54.0913900" maxlon="12.2524800"/>
 <node id="298884269" lat="54.0901746" lon="12.2482632" user="SvenHRO" uid="46882" visible="true" version="1" changeset="676636" timestamp="2008-09-21T21:37:45Z"/>
 <node id="261728686" lat="54.0906309" lon="12.2441924" user="PikoWinter" uid="36744" visible="true" version="1" changeset="323878" timestamp="2008-05-03T13:39:23Z"/>
 <node id="1831881213" version="1" changeset="12370172" lat="54.0900666" lon="12.2539381" user="lafkor" uid="75625" visible="true" timestamp="2012-07-20T09:43:19Z">
  <tag k="name" v="Neu Broderstorf"/>
  <tag k="traffic_sign" v="city_limit"/>
 </node>
 ...
 <node id="298884272" lat="54.0901447" lon="12.2516513" user="SvenHRO" uid="46882" visible="true" version="1" changeset="676636" timestamp="2008-09-21T21:37:45Z"/>
 <way id="26659127" user="Masch" uid="55988" visible="true" version="5" changeset="4142606" timestamp="2010-03-16T11:47:08Z">
  <nd ref="292403538"/>
  <nd ref="298884289"/>
  ...
  <nd ref="261728686"/>
  <tag k="highway" v="unclassified"/>
  <tag k="name" v="Pastower Straße"/>
 </way>

处理时我想检查节点名称,如“way”或“relation”(like here

我的代码如下:

    xsr.nextTag();
    while(xsr.nextTag() == XMLStreamConstants.START_ELEMENT) {

        DOMResult result = new DOMResult();
        t.transform(new StAXSource(xsr), result);
        Node domNode = result.getNode();

        System.out.println(domNode.getNodeName());
    }

我的问题是提取的节点表示为文档而不是节点。这意味着我的调试输出显示:

#document #文献 #document

每一行。 预期的输出将是&#34;节点&#34;,&#34;方式&#34;或&#34;关系&#34;。

当我解析文件然后按照here所述打印出节点时,它们会被正确打印出来。

我是StAX和DOM的新手,所以任何提示都会非常有用。

我正在使用Mac OS X 10.10.2和Java 1.8.25。

2 个答案:

答案 0 :(得分:1)

嗯,首先,你的术语令人困惑。我想当你说“节点”时你的意思是“元素节点”。该文档也是一个节点。

XSLT转换的结果是树,树总是以文档节点为根(在XSLT 1.0中,这简称为“根节点”)。您将找到要查找的元素节点作为文档/根节点的子节点。

答案 1 :(得分:1)

变化:

System.out.println(domNode.getNodeName());

为:

System.out.println(((Document)domNode).getDocumentElement().getNodeName());