将XML解析为Ruby对象并动态创建属性方法?

时间:2013-04-15 17:42:56

标签: ruby xml xml-parsing nokogiri

我需要将XML文件解析为Ruby对象。

是否有像这样从XML读取属性的工具 report.system_slots.items返回项属性数组, 或report.system_slots.current_usage返回'可用'?

Nokogiri可以这样做吗?

<page Title="System Slots" H1="Property" H2="Value" __type__="2">
  <item Property="System Slot 1">
  <item Property="Name" Value="PCI1"/>
  <item Property="Type" Value="PCI"/>
  <item Property="Data Bus Width" Value="32 bits"/>
  <item Property="Current Usage" Value="Available"/>
  <item Property="Characteristics">
    <item Property="Vcc voltage supported" Value="3.3 V, 5.0 V"/>
    <item Property="Shared" Value="No"/>
    <item Property="PME Signal" Value="Yes"/>
    <item Property="Support Hot Plug" Value="No"/>
    <item Property="PCI slot supports SMBus signal" Value="Yes"/>
  </item>
</item>

1 个答案:

答案 0 :(得分:6)

看看Ox。它读取XML并返回XML的合理Ruby对象传真。

require 'ox'

hash = {'foo' => { 'bar' => 'hello world'}}

puts Ox.dump(hash)

pp Ox.parse_obj(Ox.dump(hash))

将其转入IRB会给我:

require 'ox'

 >   hash = {'foo' => { 'bar' => 'hello world'}}
{
    "foo" => {
        "bar" => "hello world"
    }
}

 >   puts Ox.dump(hash)
<h>
  <s>foo</s>
  <h>
    <s>bar</s>
    <s>hello world</s>
  </h>
</h>
nil

 >   pp Ox.parse_obj(Ox.dump(hash))
{"foo"=>{"bar"=>"hello world"}}
{
    "foo" => {
        "bar" => "hello world"
    }
}

也就是说,您的XML示例已损坏,无法与OX一起使用。 WILL 与Nokogiri一起工作,尽管报告了错误,这会暗示您无法正确解析DOM。

我的问题是,为什么要将XML转换为对象?使用像Nokogiri这样的解析器来处理XML要容易得多。使用固定版本的XML:

require 'nokogiri'

xml = '
<xml>
<page Title="System Slots" H1="Property" H2="Value" __type__="2">
  <item Property="System Slot 1"/>
  <item Property="Name" Value="PCI1"/>
  <item Property="Type" Value="PCI"/>
  <item Property="Data Bus Width" Value="32 bits"/>
  <item Property="Current Usage" Value="Available"/>
  <item Property="Characteristics">
    <item Property="Vcc voltage supported" Value="3.3 V, 5.0 V"/>
    <item Property="Shared" Value="No"/>
    <item Property="PME Signal" Value="Yes"/>
    <item Property="Support Hot Plug" Value="No"/>
    <item Property="PCI slot supports SMBus signal" Value="Yes"/>
  </item>
</page>
</xml>'

doc = Nokogiri::XML(xml)

page = doc.at('page')
page['Title'] # => "System Slots"
page.at('item[@Property="Current Usage"]')['Value'] # => "Available"

item_properties = page.at('item[@Property="Characteristics"]')
item_properties.at('item[@Property="PCI slot supports SMBus signal"]')['Value'] # => "Yes"

将大型XML文档解析到内存中可以返回迷宫般的数组和散列,这些数组和散列仍然必须分开才能访问所需的值。使用Nokogiri,你有CSS和XPath访问器,易于学习和阅读;我使用上面的CSS,但很容易使用XPath来完成相同的事情。