如何用nokogiri解析重复的元素

时间:2011-06-05 21:28:26

标签: ruby-on-rails ruby xml nokogiri

我是Nokogiri的新手,所以如何解析"数据"和它的文字,以及 "名称"来自"方法"在以下xml中:

<get_escalators_response status="200" status_text="OK">
<escalator id="6181e65d-8ba0-4937-9c44-8f2b10b0def7">
 <name>Team alert</name>
 <comment/>
 <in_use>1</in_use>
 <condition>
   Threat level at least
   <data>
     High
     <name>level</name>
   </data>
 </condition>
 <event>
   Task run status changed
   <data>
     Done
     <name>status</name>
   </data>
 </event>
 <method>
   Email
   <data>
     team@example.org
     <name>to_address</name>
   </data>
   <data>
     admin@example.org
     <name>from_address</name>
   </data>
   <data>
     0
     <name>notice</name>
   </data>
 </method>
</escalator>
...
</get_escalators_response>

2 个答案:

答案 0 :(得分:1)

将XML分配给名为xml的变量,我会这样做:

require 'nokogiri'
require 'pp'

doc = Nokogiri::XML(xml)
pp doc.search('//method/data').map{ |n| n.text.scan(/\S+/) }

请注意,这是返回一个数组数组。将数据强制转换为字符串或哈希值很容易。

# >> [["team@example.org", "to_address"],
# >>  ["admin@example.org", "from_address"],
# >>  ["0", "notice"]]

答案 1 :(得分:0)

有几种方法可以做到这一点,其中一种方法是:

doc = Nokogiri::XML("your_xml_document")
doc.search("data").each do |data|
  name = data.search("name").remove # remove the name element from data element
  name_text = name.text
  data_text = data.text
  # do stuff with text
end

您可以搜索特定的嵌套元素,如下所示:

doc.search("method > data").each do |data|
  # do stuff
end