如何在Nokogiri XML DocumentFragment中迭代特定名称的子节点?

时间:2011-12-18 14:57:29

标签: ruby xml xml-parsing nokogiri

在名为“string”的字符串中给出这个XML:

<Guide>
  <Master>
    <Part>12345</Part>
    <Sub>
       <Name>A</Name>
    </Sub>
    <Sub>
       <Name>B</Name>
    </Sub>
  </Master>
  <Master>
    <Part>XYZABC</Part>
    <Sub>
       <Name>A</Name>
    </Sub>
    <Sub>
       <Name>C</Name>
    </Sub>
  </Master>
</Guide>

这行代码:

bgdoc = Nokogiri::XML::DocumentFragment.parse(xstring.to_xml)

我想遍历名为“Part”的所有节点。

我尝试了以下内容:

bgdoc.xpath("//Part").each do |node|

bgdoc.children.each do |node|
  next unless node.name=="Part"

但那没用。

4 个答案:

答案 0 :(得分:8)

问题是将XML解析为片段会返回一个部分XML文档,即DocumentFragment,它没有根目录:

1.9.2-p290 :002 > doc = Nokogiri::XML::DocumentFragment.parse('<a><b>foo</b></a>').root
NoMethodError: undefined method `root' for #<Nokogiri::XML::DocumentFragment:0x00000100b34448>
    from (irb):2
    from /Users/greg/.rvm/rubies/ruby-1.9.2-p290/bin/irb:16:in `<main>'

而完整的XML文档确实有一个root:

1.9.2-p290 :003 > doc = Nokogiri::XML('<a><b>foo</b></a>').root
 => #<Nokogiri::XML::Element:0x8058b350 name="a" children=[#<Nokogiri::XML::Element:0x80587b10 name="b" children=[#<Nokogiri::XML::Text:0x80587818 "foo">]>]> 

默认情况下,Nokogiri将使用类似//Path的XPath从文档的根目录进行搜索:

1.9.2-p290 :004 > doc = Nokogiri::XML('<a><Path>foo</Path></a>').search('//Path')
 => [#<Nokogiri::XML::Element:0x8055465c name="Path" children=[#<Nokogiri::XML::Text:0x805543c8 "foo">]>] 

但是因为缺少root而导致片段失败:

1.9.2-p290 :005 > doc = Nokogiri::XML::DocumentFragment.parse('<a><Path>foo</Path></a>').search('//Path')
 => [] 

诀窍是告诉Nokogiri在处理片段时应该在哪里看。使用相对搜索或通配符:

1.9.2-p290 :006 > doc = Nokogiri::XML::DocumentFragment.parse('<a><Path>foo</Path></a>').search('.//Path')
 => [#<Nokogiri::XML::Element:0x8053c69c name="Path" children=[#<Nokogiri::XML::Text:0x8053c46c "foo">]>] 

1.9.2-p290 :007 > doc = Nokogiri::XML::DocumentFragment.parse('<a><Path>foo</Path></a>').search('*//Path')
 => [#<Nokogiri::XML::Element:0x8052a208 name="Path" children=[#<Nokogiri::XML::Text:0x80529fec "foo">]>] 

答案 1 :(得分:2)

bgdoc = Nokogiri::XML::DocumentFragment.parse(<<EOF)
  <xml stuff>
EOF

bgdoc.xpath(".//Part").each do |node|
  # some instruction
end

答案 2 :(得分:1)

如果你只有一个字符串,只需用Nokogiri:XML解析:

bgdoc = Nokogiri::XML.parse(string)

将为您提供一个根,您可以根据预期使用xpath //Part

答案 3 :(得分:0)

bgdoc.css("Part")

应该做的。