Nokogiri每个节点都做,Ruby

时间:2013-08-10 08:26:52

标签: ruby nokogiri

我有这个xml:

   <kapitel>
      <nummer V="1"/>
      <von_icd_code V="A00"/>
      <bis_icd_code V="B99"/>
      <bezeichnung V="Bestimmte infektiöse und parasitäre Krankheiten"/>
      <gruppen_liste>
        <gruppe>
          <von_icd_code V="A00"/>
          <bis_icd_code V="A09"/>
          <bezeichnung V="Infektiöse Darmkrankheiten"/>
          <diagnosen_liste>
            <diagnose>
              <icd_code V="A00.-"/>
              <bezeichnung V="Cholera"/>
              <abrechenbar V="n"/>
              <krankheit_in_mitteleuropa_sehr_selten V="j"/>
              <schlüsselnummer_mit_inhalt_belegt V="j"/>
              <infektionsschutzgesetz_meldepflicht V="j"/>
              <infektionsschutzgesetz_abrechnungsbesonderheit V="j"/>

如何查看我的第一个节点 kapitel 。我想做像 kapitel .each do | f |这样的事情因此nokgiri以正确的顺序提取节点von_icd_code和bis_icd_code。我的代码:

    require 'rubygems'
    require 'nokogiri'   
    require 'open-uri'

 @doc = Nokogiri::XML(File.open("icd.xml"))

  kapitel = @doc.css('kapitel')
   kapitel.each do |f|
    puts f.css('von_icd_code')  
    puts f.css('bis_icd_code')  
   end

问题是nogiri没有在右边的oder中发出'von_icd_code'和'bis_icd_code',而是首先列出所有的von_icd_code,然后是所有'bis_icd_code'。我怎样才能在正确的奥得河中提取节点?

在我的输出中,我得到:

<von_icd_code V="A00"/>

在这种情况下,我怎样才能获得V的内容 A00

谢谢!

3 个答案:

答案 0 :(得分:7)

您可以使用Nokogiri的traverse方法,该方法以递归方式遍历所有XML节点。

您的示例将与此类似:

names = %w(von_icd_code bis_icd_code)
@doc.traverse {|node| p node['V'] if names.include? node.name}

打印出来

"A00"
"B99"
"A00"
"A09"

Nokogiri::Node中有很多巧妙的东西可以让我们用最复杂的XML文件做很酷的事情。有关它们的简短列表,您可以查看at this cheat sheet

祝你好运!

答案 1 :(得分:5)

由于bis_icd_code跟随每个von_icd_code,显而易见的选择是css的+下一个相邻的兄弟选择器:

doc.css('von_icd_code').each do |icd|
  puts icd['V']
  puts icd.at('+ bis_icd_code')['V']
end
#=> A00
#=> B99
#=> A00
#=> A09

答案 2 :(得分:2)

<强>更新

对不起,这对CSS选择器不起作用。请改用XPath。对于您的第二个问题,可以使用V在Nokogiri中访问节点node的属性node['V']。喜欢这个

kapitel = @doc.xpath('//kapitel')
kapitel.each do |f|
  f.xpath('//von_icd_code | //bis_icd_code').each do |node|
    puts node['V'] 
  end
end

<强>输出

A00
B99
A00
A09

你可以通过编写

来解决这个问题,而不需要traverse的奢侈
kapitel.each do |f|
  puts f.css('von_icd_code, bis_icd_code')
end