使用xpath和vtd-xml将元素的子节点和文本作为字符串

时间:2011-05-14 19:31:39

标签: java xml xpath vtd-xml

这是我的XML的一部分:

<MAIN>
    <L>
        <D>string1 string2 <b>string3</b> string4</D>
    </L>
    <L>
        <D>string5 string6 <b>string7</b> string8 <i>string9</i></D>
    </L>
</MAIN>

I want to get the content of all the <D> tags as string. So, the example above should return:

1st iteration: 'string1 string2 <b>string3</b> string4'
2nd iteration: 'string5 string6 <b>string7</b> string8 <i>string9</i>'
etc...

在vtd-xml中,我使用了带XPath的AutoPilot&#34; // L / D&#34;和&#34; // L / D / text()&#34;但那没用。

任何建议或替代方法都将受到赞赏。

此致

2 个答案:

答案 0 :(得分:13)

以下是执行您所需要的代码。

    VTDGen vg =  new VTDGen();
    if (vg.parseFile("c://xml//alex.txt", true)){
        VTDNav vn = vg.getNav();
        AutoPilot ap = new AutoPilot(vn);
        ap.selectXPath("//L/D");
        int i=-1;
        while((i=ap.evalXPath())!=-1){
            long l = vn.getContentFragment();
            System.out.println(" -==> "+ vn.toString((int )l, (int)(l>>32)));
        }
    }

答案 1 :(得分:3)

使用

/*/L/D/node()

这将选择作为任何D元素的子元素的所有节点(元素,文本节点,处理指令和注释节点),该元素是任何L元素的子元素。 XML文档的顶部元素。

或者,您可以单独选择两个/*/L/D元素的所有节点子元素

/*/L[1]/D/node()

/*/L[2]/D/node()

使用XSLT作为XPath主机进行验证

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>

 <xsl:template match="/">
  <xsl:copy-of select="/*/L[1]/D/node()"/>
--------------------
  <xsl:copy-of select="/*/L[2]/D/node()"/>
 </xsl:template>
</xsl:stylesheet>

应用于提供的XML文档

<MAIN>
    <L>
        <D>string1 string2 
            <b>string3</b> string4
        </D>
    </L>
    <L>
        <D>string5 string6 
            <b>string7</b> string8 
            <i>string9</i>
        </D>
    </L>
</MAIN>

产生了想要的正确结果

string1 string2 
            <b>string3</b> string4

--------------------
  string5 string6 
            <b>string7</b> string8 
            <i>string9</i>