我正在使用Ruby,Norkigiri和Nori。我想知道如何解析这个XML文件。
在此架构中,实体可以包含多个联系人。
我需要返回以下哈希值:
我考虑过使用xpath尝试返回首选的电子邮件联系人。
entities = doc.xpath("/entity_list/entity").each do |entity|
puts entity.xpath("contact_list/contact[contains(type,'Email') and contains(preferred, '1')]")
end
<entity>
<id>21925</id>
<last_name>Smith</last_name>
<first_name>John</first_name>
<preferred_name>Johnny</preferred_name>
<manager>Timmy</manager>
<dob>1970-01-01</dob>
<type>individual</type>
<contact_list>
<contact>
<type>Mobile Phone</type>
<preferred>0</preferred>
<value>563478653478</value>
</contact>
<contact>
<type>Pager</type>
<preferred>0</preferred>
<value>7354635345</value>
</contact>
<contact>
<notes>None</notes>
<type>Home Email</type>
<preferred>1</preferred>
<value>johhny@smith.com</value>
<comments>None</comments>
</contact>
<contact>
<notes>None</notes>
<type>Work Email</type>
<preferred>0</preferred>
<value>johhny@gmail.com</value>
<comments>None</comments>
</contact>
<contact>
<type>Home Phone</type>
<preferred>1</preferred>
<value>56537646365</value>
</contact>
</contact_list>
</entity>
解决此问题的最佳方法是什么?
由于
答案 0 :(得分:1)
这是一种做法(根据您的初始解决方案,我的头脑):
entities = doc.xpath("/entity_list/entity").map do |entity|
{
:id => entity.at_xpath("id").content.to_i,
:first_name => entity.at_xpath("first_name").content,
:last_name => entity.at_xpath("last_name").content,
:preferred_email => entity.at_xpath("contact_list/contact[contains(type,'Email') and contains(preferred, '1')]/value").content,
:manager => entity.at_xpath("manager").content
}
end
修改强>
要从丢失的节点中解救,您可以使用ActiveSupport的try
方法,或者只需将rescue nil
添加到每行的末尾,例如:
:first_name => (entity.at_xpath("first_name").content rescue nil),
但最好使用辅助方法,例如:
def get_node_content(entity, xpath)
node = entity.send(:at_xpath, xpath)
node ? node.content : nil
end
然后你就可以使用它:
:first_name => get_node_content(entity, "first_name"),