XML解析并转换为哈希 - Ruby

时间:2013-09-13 07:54:36

标签: ruby xml-parsing

我正在使用Ruby,Norkigiri和Nori。我想知道如何解析这个XML文件。

在此架构中,实体可以包含多个联系人。

我需要返回以下哈希值:

  • :ID
  • :如first_name
  • :last_name
  • :preferred_email
  • :管理器

我考虑过使用xpath尝试返回首选的电子邮件联系人。

entities = doc.xpath("/entity_list/entity").each do |entity|
   puts entity.xpath("contact_list/contact[contains(type,'Email') and contains(preferred, '1')]")
end



  <entity>
    <id>21925</id>
    <last_name>Smith</last_name>
    <first_name>John</first_name>
    <preferred_name>Johnny</preferred_name>
    <manager>Timmy</manager>
    <dob>1970-01-01</dob>
    <type>individual</type>
    <contact_list>
      <contact>
        <type>Mobile Phone</type>
        <preferred>0</preferred>
        <value>563478653478</value>
      </contact>
      <contact>
        <type>Pager</type>
        <preferred>0</preferred>
        <value>7354635345</value>
      </contact>
      <contact>
        <notes>None</notes>
        <type>Home Email</type>
        <preferred>1</preferred>
        <value>johhny@smith.com</value>
        <comments>None</comments>
      </contact>
      <contact>
        <notes>None</notes>
        <type>Work Email</type>
        <preferred>0</preferred>
        <value>johhny@gmail.com</value>
        <comments>None</comments>
      </contact>
      <contact>
        <type>Home Phone</type>
        <preferred>1</preferred>
        <value>56537646365</value>
      </contact>
     </contact_list>
     </entity>

解决此问题的最佳方法是什么?

由于

1 个答案:

答案 0 :(得分:1)

这是一种做法(根据您的初始解决方案,我的头脑):

entities = doc.xpath("/entity_list/entity").map do |entity|
  {
    :id => entity.at_xpath("id").content.to_i,
    :first_name => entity.at_xpath("first_name").content,
    :last_name => entity.at_xpath("last_name").content,
    :preferred_email => entity.at_xpath("contact_list/contact[contains(type,'Email') and contains(preferred, '1')]/value").content,
    :manager => entity.at_xpath("manager").content
  }
end

修改

要从丢失的节点中解救,您可以使用ActiveSupport的try方法,或者只需将rescue nil添加到每行的末尾,例如:

:first_name => (entity.at_xpath("first_name").content rescue nil),

但最好使用辅助方法,例如:

def get_node_content(entity, xpath)
  node = entity.send(:at_xpath, xpath)
  node ? node.content : nil
end

然后你就可以使用它:

:first_name => get_node_content(entity, "first_name"),