如何使用xmlstarlet打印XPath匹配项的位置?

时间:2019-01-08 17:46:32

标签: xmlstarlet

我想在pom.xml文件中找到对SNAPSHOT版本的引用。让我们以here中的POM文件为例。我想出了以下命令来查找包含字符串SNAPSHOT的元素:

$ xmlstarlet sel -t -m "//*[contains(text(), 'SNAPSHOT')]" -v . -n pom.xml
0.2-SNAPSHOT
4.12-SNAPSHOT
1.9.13-SNAPSHOT
20.0-SNAPSHOT

但是,正如上面可以看到的那样,这仅给了我自己的匹配文本。我想看到的是有关匹配位置的更多上下文,例如通向匹配元素的路径,如下所示:

$ xmlstarlet magical arguments
/project/version: 0.2-SNAPSHOT
/project/dependencies/dependency: 4.12-SNAPSHOT
/project/properties/jackson.version: 1.9.13-SNAPSHOT
/project/properties/guava.version: 20.0-SNAPSHOT

或者,将XML的精简版本作为输出也对我有用,例如:

$ xmlstarlet magical arguments
<project>
  <version>0.2-SNAPSHOT</version>
  <dependencies>
    <dependency>
      <version>4.12-SNAPSHOT</version>
    </dependency>
  </dependencies>
  <properties>
    <jackson.version>1.9.13-SNAPSHOT</jackson.version>
    <guava.version>20.0-SNAPSHOT</guava.version>
  </properties>
</project>

是否可以打印这些或匹配发生位置的其他指示?

3 个答案:

答案 0 :(得分:2)

xmlstarlet可以使用-b选项产生请求的输出,该选项可以打破嵌套:

xmlstarlet sel -t \
    -m "//*[contains(text(),'SNAPSHOT')]" \
    -m 'ancestor::*' -v 'name()' -o '/' \
    -b -v "concat(name(),': ',.)" -n pom.xml

输出:

project/version: 0.2-SNAPSHOT
project/dependencies/dependency/version: 4.12-SNAPSHOT
project/properties/jackson.version: 1.9.13-SNAPSHOT
project/properties/guava.version: 20.0-SNAPSHOT

答案 1 :(得分:1)

我无法使用选择工具产生所需的结果。但是,我确实设法修改了生成的XSL以适合您的需求。

我用-C开关生成了XSL:

xmlstarlet sel -C -t -m "//*[contains(text(), 'SNAPSHOT')]" -m 'ancestor-or-self::*' -v 'name()' -o / -n

输出:

<?xml version="1.0"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:exslt="http://exslt.org/common" version="1.0" extension-element-prefixes="exslt">
  <xsl:output omit-xml-declaration="yes" indent="no"/>
  <xsl:template match="/">
    <xsl:for-each select="//*[contains(text(), 'SNAPSHOT')]">
      <xsl:for-each select="ancestor-or-self::*">
        <xsl:call-template name="value-of-template">
          <xsl:with-param name="select" select="name()"/>
        </xsl:call-template>
        <xsl:text>/</xsl:text>
        <xsl:value-of select="'&#10;'"/>
      </xsl:for-each>
    </xsl:for-each>
  </xsl:template>
  <xsl:template name="value-of-template">
    <xsl:param name="select"/>
    <xsl:value-of select="$select"/>
    <xsl:for-each select="exslt:node-set($select)[position()&gt;1]">
      <xsl:value-of select="'&#10;'"/>
      <xsl:value-of select="."/>
    </xsl:for-each>
  </xsl:template>
</xsl:stylesheet>

然后我应用了以下补丁:

11d10
<         <xsl:value-of select="'&#10;'"/>
12a12,13
>       <xsl:value-of select="text()"/>
>       <xsl:value-of select="'&#10;'"/>

结果:

<?xml version="1.0"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:exslt="http://exslt.org/common" version="1.0" extension-element-prefixes="exslt">
  <xsl:output omit-xml-declaration="yes" indent="no"/>
  <xsl:template match="/">
    <xsl:for-each select="//*[contains(text(), 'SNAPSHOT')]">
      <xsl:for-each select="ancestor-or-self::*">
        <xsl:call-template name="value-of-template">
          <xsl:with-param name="select" select="name()"/>
        </xsl:call-template>
        <xsl:text>/</xsl:text>
      </xsl:for-each>
      <xsl:value-of select="text()"/>
      <xsl:value-of select="'&#10;'"/>
    </xsl:for-each>
  </xsl:template>
  <xsl:template name="value-of-template">
    <xsl:param name="select"/>
    <xsl:value-of select="$select"/>
    <xsl:for-each select="exslt:node-set($select)[position()&gt;1]">
      <xsl:value-of select="'&#10;'"/>
      <xsl:value-of select="."/>
    </xsl:for-each>
  </xsl:template>
</xsl:stylesheet>

如果将此转换应用于原始xml文件,则会得到所需的结果:

xmlstarlet tr modified.xsl input.xml

输出:

project/version/0.2-SNAPSHOT 
project/dependencies/dependency/version/4.12-SNAPSHOT
project/properties/jackson.version/1.9.13-SNAPSHOT
project/properties/guava.version/20.0-SNAPSHOT

答案 2 :(得分:0)

我想出了以下方法来生成XML的精简版本:

xmlstarlet ed -d "//*[count((.|.//*)[contains(text(), 'SNAPSHOT')]) = 0]" pom.xml

输出:

<?xml version="1.0"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
  <version>0.2-SNAPSHOT</version>
  <dependencies>
    <dependency>
      <version>4.12-SNAPSHOT</version>
    </dependency>
  </dependencies>
  <properties>
    <jackson.version>1.9.13-SNAPSHOT</jackson.version>
    <guava.version>20.0-SNAPSHOT</guava.version>
  </properties>
</project>

这个想法是删除每个不包含文本SNAPSHOT也不包含任何后代的节点。我不是很喜欢我必须使用(.|.//*)来匹配当前节点或其后代,必须有更好的方法,但是我发现普通的.//*与当前节点不匹配,只有它的后代。