合并Nokogiri中的两个XML文件

时间:2015-06-23 16:41:10

标签: ruby xml nokogiri

有一些关于这个主题的帖子,但我无法弄清楚如何解决我的问题。

我有两个XML文件:

<Products>
  <Product>
    <some>
      <value></value>
    </some>
  </Product>
  <Product>
    <more>
      <data></data>
    </more>
  </Product>
</Products>

<Products>
  <Product>
    <some_other>
      <value></value>
    </some_other>
  </Product>
</Products>

我想生成一个如下所示的XML文档:

<Products>
  <Product>
    <some>
      <value></value>
    </some>
  </Product>
  <Product>
    <more>
      <data></data>
    </more>
  </Product>
  <Product>
    <some_other>
      <value></value>
    </some_other>
  </Product>
</Products>

每个节点<Product>都应合并到<Products>

我尝试使用以下方法创建新文档:

doc = Nokogiri::XML("<Products></Products>")
nodes = files.map { |xml| Nokogiri::XML(xml).xpath("//Product") }
set = Nokogiri::XML::NodeSet.new(doc, nodes)

但这会引发错误:ArgumentError: node must be a Nokogiri::XML::Node or Nokogiri::XML::Namespace

我想我不理解NodeSet,但我无法弄清楚如何合并这两个XML文件。

1 个答案:

答案 0 :(得分:3)

您的示例代码无法生成您想要的内容,因为您在执行此操作时会丢弃somemore个节点:

doc = Nokogiri::XML("<Products></Products>")

不需要创建一个空DOM,而是需要搭载原始DOM并简单地将新节点附加到它:

require 'nokogiri'

xml1 = '<Products>
  <Product>
    <some>
      <value></value>
    </some>
  </Product>
  <Product>
    <more>
      <data></data>
    </more>
  </Product>
</Products>
'

xml2 = '<Products>
  <Product>
    <some_other>
      <value></value>
    </some_other>
  </Product>
</Products>
'

doc = Nokogiri::XML(xml1)

找到要添加的新Product个节点:

new_products = Nokogiri::XML(xml2).search('Product')

Products

的子项添加到原始文档中
doc.at('Products').add_child(new_products)

这导致doc中的DOM看起来像:

puts doc.to_xml
# >> <?xml version="1.0"?>
# >> <Products>
# >>   <Product>
# >>     <some>
# >>       <value/>
# >>     </some>
# >>   </Product>
# >>   <Product>
# >>     <more>
# >>       <data/>
# >>     </more>
# >>   </Product>
# >> <Product>
# >>     <some_other>
# >>       <value/>
# >>     </some_other>
# >>   </Product></Products>