将XML文档解析为单独的xpath而无需文档预知

时间:2013-03-05 03:13:04

标签: xml xpath xml-parsing

给出以下XML文档:

<Element0 AttributeA="A">
  <Element1 AttributeB="1" AttributeC="C" AttributeD="D">
    <Element2>nodeValue</Element2>
  </Element1>
  <Element1 AttributeB="2" AttributeC="C" AttributeD="D">
    <Element2>nodeValue</Element2>
    <Element3 AttributeE="E">
        <Element4 AttributeF="F">nodeValue</Element4>
    </Element3>
  </Element1>
  .
  .
  .
  .
</Element0>

如何解析(剪切,解构,翻译)文档到单个xpath(见下文) ,不用 预先知道xml文档的内容?< / p>

//Element0[@AttributeA='A']/Element1[@AttributeB='1' and @AttributeC='C' and @AttributeD='D']/Element2
//Element0[@AttributeA='A']/Element1[@AttributeB='2' and @AttributeC='C' and @AttributeD='D']/Element2
//Element0[@AttributeA='A']/Element1[@AttributeB='2' and @AttributeC='C' and @AttributeD='D']/Element3[@AttributeE='E']/Element4[@AttributeF='F']

2 个答案:

答案 0 :(得分:1)

我就是这样做的。请注意,我还包括位置,因此您可以为每个元素获得完全唯一的XPath,即使它与其中一个兄弟元素具有完全相同的属性。

XML输入

<Element0 AttributeA="A">
    <Element1 AttributeB="1" AttributeC="C" AttributeD="D">
        <Element2>nodeValue</Element2>
    </Element1>
    <Element1 AttributeB="2" AttributeC="C" AttributeD="D">
        <Element2>nodeValue</Element2>
        <Element3 AttributeE="E">
            <Element4 AttributeF="F">nodeValue</Element4>
        </Element3>
    </Element1>
</Element0>

XSLT 1.0

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output method="text"/>
    <xsl:strip-space elements="*"/>

    <xsl:template match="text()"/>

    <xsl:template match="*">
        <xsl:for-each select="ancestor-or-self::*">
            <xsl:value-of select="concat('/',local-name())"/>
            <xsl:value-of select="concat('[',count(preceding-sibling::*[local-name()=local-name(current())])+1,']')"/>
            <xsl:if test="@*">
                <xsl:text>[</xsl:text>
                <xsl:apply-templates select="@*"/>
                <xsl:text>]</xsl:text>
            </xsl:if>
        </xsl:for-each>
        <xsl:text>&#xA;</xsl:text>
        <xsl:apply-templates select="node()"/>
    </xsl:template>

    <xsl:template match="@*">
        <xsl:if test="position() != 1">
            <xsl:text> and </xsl:text>
        </xsl:if>
        <xsl:value-of select="concat('@',local-name(),'=&quot;',.,'&quot;')"/>
    </xsl:template>

</xsl:stylesheet>

<强>输出

/Element0[1][@AttributeA="A"]
/Element0[1][@AttributeA="A"]/Element1[1][@AttributeB="1" and @AttributeC="C" and @AttributeD="D"]
/Element0[1][@AttributeA="A"]/Element1[1][@AttributeB="1" and @AttributeC="C" and @AttributeD="D"]/Element2[1]
/Element0[1][@AttributeA="A"]/Element1[2][@AttributeB="2" and @AttributeC="C" and @AttributeD="D"]
/Element0[1][@AttributeA="A"]/Element1[2][@AttributeB="2" and @AttributeC="C" and @AttributeD="D"]/Element2[1]
/Element0[1][@AttributeA="A"]/Element1[2][@AttributeB="2" and @AttributeC="C" and @AttributeD="D"]/Element3[1][@AttributeE="E"]
/Element0[1][@AttributeA="A"]/Element1[2][@AttributeB="2" and @AttributeC="C" and @AttributeD="D"]/Element3[1][@AttributeE="E"]/Element4[1][@AttributeF="F"]

答案 1 :(得分:0)

XMLStarlet如果您将其用作xml el -v file.xml,则会执行非常类似的操作。它将为您提供带有值的路径和属性。但是,它不会在路径中间为您提供属性,只是当该节点是提示时。例如,它产生:

Element0[@AttributeA='A']
Element0/Element1[@AttributeB='1' and @AttributeC='C' and @AttributeD='D']
Element0/Element1/Element2
Element0/Element1[@AttributeB='2' and @AttributeC='C' and @AttributeD='D']
Element0/Element1/Element2
Element0/Element1/Element3[@AttributeE='E']
Element0/Element1/Element3/Element4[@AttributeF='F']