XPath使用xml_grep指定的访问属性

时间:2013-08-28 19:28:37

标签: xml perl xpath grep

如何使用xml_grep

访问通过XPath指定的属性的值

我试过了:

# svn info http://unladen-swallow.googlecode.com/svn/trunk/ --xml > x
# cat x
<?xml version="1.0"?>
<info>
<entry
   kind="dir"
   path="trunk"
   revision="1171">
<url>http://unladen-swallow.googlecode.com/svn/trunk</url>
<repository>
<root>http://unladen-swallow.googlecode.com/svn</root>
<uuid>05521daa-c0b4-11dd-bb00-bd6ab96fe29a</uuid>
</repository>
<commit
   revision="1171">
<author>ebo@4geeks.de</author>
<date>2010-08-21T18:17:31.382601Z</date>
</commit>
</entry>
</info>



# xml_grep uuid x --text_only
05521daa-c0b4-11dd-bb00-bd6ab96fe29a
# xml_grep //info/entry/@path x --text_only # correct XPath syntax
error: unrecognized expression in handler: '//info/entry/@path' at /usr/bin/xml_grep line 198
# xml_grep //info/entry/[@path] x --text_only
# # no output

我查看了在线帮助页面,但是唯一与属性匹配的语法过于冗长:

# xml_grep '*[@path]' x
<?xml version="1.0" ?>
<xml_grep version="0.7" date="Wed Aug 28 15:22:13 2013">
<file filename="x">
  <entry kind="dir" path="trunk" revision="1171">
    <url>http://unladen-swallow.googlecode.com/svn/trunk</url>
    <repository>
      <root>http://unladen-swallow.googlecode.com/svn</root>
      <uuid>05521daa-c0b4-11dd-bb00-bd6ab96fe29a</uuid>
    </repository>
    <commit revision="1171">
      <author>ebo@4geeks.de</author>
      <date>2010-08-21T18:17:31.382601Z</date>
    </commit>
  </entry>
</file>
</xml_grep>
#

正确的语法是什么?

1 个答案:

答案 0 :(得分:3)

xml_grep是一个使用Perl的XML::Twig模块的非常简单的工具。 类XPath 表达式的允许sytax为documented there。似乎无法提取像这样的属性的值。

我建议改为使用xpath程序:

$ xpath x '//entry/@path'
Found 1 nodes:
-- NODE --
 path="trunk"

此程序应与XML::Xpath捆绑在一起。


如果一切都失败了,那就滚动一下吧。我选择的武器是XML::LibXML

use strict; use warnings;
use XML::LibXML;

my ($file, $query) = @ARGV;

my $xml = XML::LibXML->load_xml(location => $file);
print $xml->findvalue($query), "\n";

然后$ perl xpath-findvalue.pl x '//entry/@path'。输出:trunk