Nokogiri和XPath有帮助

时间:2010-08-25 14:56:36

标签: ruby xml xpath nokogiri

不可否认,我是Nokogiri的新手,我必须遗漏一些东西......

我只是想打印作者>此XML中的名称节点:

<?xml version="1.0" encoding="UTF-8"?>
<entry xmlns:gd="http://schemas.google.com/g/2005" xmlns:docs="http://schemas.google.com/docs/2007" xmlns="http://www.w3.org/2005/Atom" gd:etag="">
  <category term="http://schemas.google.com/docs/2007#document" scheme="http://schemas.google.com/g/2005#kind"/>
  <author>
    <name>Matt</name>
    <email>Darby</email>
  </author>
  <title>Title</title>
</entry>

我正在尝试使用它,但它什么都没打印。看似没有节点(甚至'*')什么都不返回。

  Nokogiri::XML(@xml_string).xpath("//author/name").each do |node|
    puts node
  end

2 个答案:

答案 0 :(得分:13)

亚历杭德罗已经回答了这个in his comment(+1),但我也加入了这个答案,因为他遗漏了Nokogiri代码。

使用带有XPath的Nokogiri

选择某些命名空间中的元素

您尝试选择的元素位于默认命名空间中,在这种情况下似乎是http://www.w3.org/2005/Atom。请注意xmlns="元素上的entry属性。您的XPath表达式会匹配不在任何名称空间中的元素。这就是为什么你的代码没有名称空间的原因

您需要为XPath表达式定义名称空间上下文,并指出XPath步骤以匹配该名称空间中的元素。 AFAIK使用Nokogiri应该有几种不同的方法可以实现这一点,其中一种方法如下所示

xml.xpath("//a:author/a:name", {"a" => "http://www.w3.org/2005/Atom"})

请注意,这里我们定义了一个名称空间到前缀的映射,并在XPath表达式中使用了这个前缀(a)。

答案 1 :(得分:7)

出于某种原因,使用remove_namespaces!会使上面的位按预期工作。

xml = Nokogiri::XML(@xml_string)
xml.remove_namespaces!
xml.xpath("//author/name").each do |node|
  puts node.text
end

=> "Matt"