我有这个xml:
<kapitel>
<nummer V="1"/>
<von_icd_code V="A00"/>
<bis_icd_code V="B99"/>
<bezeichnung V="Bestimmte infektiöse und parasitäre Krankheiten"/>
<gruppen_liste>
<gruppe>
<von_icd_code V="A00"/>
<bis_icd_code V="A09"/>
<bezeichnung V="Infektiöse Darmkrankheiten"/>
<diagnosen_liste>
<diagnose>
<icd_code V="A00.-"/>
<bezeichnung V="Cholera"/>
<abrechenbar V="n"/>
<krankheit_in_mitteleuropa_sehr_selten V="j"/>
<schlüsselnummer_mit_inhalt_belegt V="j"/>
<infektionsschutzgesetz_meldepflicht V="j"/>
<infektionsschutzgesetz_abrechnungsbesonderheit V="j"/>
如何查看我的第一个节点 kapitel 。我想做像 kapitel .each do | f |这样的事情因此nokgiri以正确的顺序提取节点von_icd_code和bis_icd_code。我的代码:
require 'rubygems'
require 'nokogiri'
require 'open-uri'
@doc = Nokogiri::XML(File.open("icd.xml"))
kapitel = @doc.css('kapitel')
kapitel.each do |f|
puts f.css('von_icd_code')
puts f.css('bis_icd_code')
end
问题是nogiri没有在右边的oder中发出'von_icd_code'和'bis_icd_code',而是首先列出所有的von_icd_code,然后是所有'bis_icd_code'。我怎样才能在正确的奥得河中提取节点?
在我的输出中,我得到:
<von_icd_code V="A00"/>
在这种情况下,我怎样才能获得V的内容 A00
谢谢!
答案 0 :(得分:7)
您可以使用Nokogiri的traverse
方法,该方法以递归方式遍历所有XML节点。
您的示例将与此类似:
names = %w(von_icd_code bis_icd_code)
@doc.traverse {|node| p node['V'] if names.include? node.name}
打印出来
"A00"
"B99"
"A00"
"A09"
Nokogiri::Node
中有很多巧妙的东西可以让我们用最复杂的XML文件做很酷的事情。有关它们的简短列表,您可以查看at this cheat sheet。
答案 1 :(得分:5)
由于bis_icd_code
跟随每个von_icd_code
,显而易见的选择是css的+
下一个相邻的兄弟选择器:
doc.css('von_icd_code').each do |icd|
puts icd['V']
puts icd.at('+ bis_icd_code')['V']
end
#=> A00
#=> B99
#=> A00
#=> A09
答案 2 :(得分:2)
<强>更新强>
对不起,这对CSS选择器不起作用。请改用XPath。对于您的第二个问题,可以使用V
在Nokogiri中访问节点node
的属性node['V']
。喜欢这个
kapitel = @doc.xpath('//kapitel')
kapitel.each do |f|
f.xpath('//von_icd_code | //bis_icd_code').each do |node|
puts node['V']
end
end
<强>输出强>
A00
B99
A00
A09
你可以通过编写
来解决这个问题,而不需要traverse
的奢侈
kapitel.each do |f|
puts f.css('von_icd_code, bis_icd_code')
end