我使用Ruby来读取XML文档并使用新值更新单个节点(如果存在)。
http://www.nokogiri.org/tutorials/modifying_an_html_xml_document.html 对我来说,如何更改节点数据并不明显,更不用说如何将其保存回文件。
def ammend_parent_xml(folder, target_file, new_file)
# open parent XML file that contains file reference
get_xml_files = Dir.glob("#{@target_folder}/#{folder}/*.xml").sort.select {|f| !File.directory? f}
get_xml_files.each { |xml|
f = File.open(xml)
# Use Nokgiri to read the file into an XML object
doc = Nokogiri::XML(f)
filename = doc.xpath('//Route//To//Node//FileName')
filename.each_with_index {
|fl, i|
if target_file == fl.text
# we found the file, now rename it to new_file
# ???????
end
}
}
end
这是一些示例XML:
<?xml version="1.0" encoding="utf-8">
<my_id>123</my_id>
<Route>
<To>
<Node>
<Filename>file1.txt</Filename>
<Filename>file2.mp3</Filename>
<Filename>file3.doc</Filename>
<Filename>file4.php</Filename>
<Filename>file5.jpg</Filename>
</Node>
</To>
</Route>
</xml>
我想改变&#34; file3.doc&#34;到&#34; file3_new.html&#34;。
我会打电话:
def ammend_parent_xml("folder_location", "file3.doc", "file3_new.html")
答案 0 :(得分:4)
def amend_parent_xml(folder, target_file, new_file)
Dir["#{@target_folder}/#{folder}/*.xml"]
.sort.select{|f| !File.directory? f }
.each do |xml_file|
doc = Nokogiri.XML( File.read(xml_file) )
if file = doc.at("//Route//To//Node//Filename[.='#{target_file}']")
file.content = new_file # set the text of the node
File.open(xml_file,'w'){ |f| f<<doc }
break
end
end
end
改进:
File.read
代替File.open
,这样就不会让文件句柄处于打开状态。if file=files.find{ |f| f.text==target_file }
Nokogiri::XML::Document
序列化回磁盘。答案 1 :(得分:3)
要更改XML中的元素:
@doc = Nokogiri::XML::DocumentFragment.parse <<-EOXML
<body>
<h1>OLD_CONTENT</h1>
<div>blah</div>
</body>
EOXML
h1 = @doc.at_xpath "body/h1"
h1.content = "NEW_CONTENT"
puts @doc.to_xml #h1 will be NEW_CONTENT
保存XML:
file = File.new("xml_file.xml", "wb")
file.write(@doc)
file.close
您的示例XML存在一些问题。
my_id
和Route
?
</xml>
吗?在修复样本后,我可以使用Phrogz的例子来获取元素:
element = @doc.xpath("Route//To//Node//Filename[.='#{target_file}']").first
注意.first
,因为它将返回一个NodeSet。
然后我会用以下内容更新内容:
element.content = "foobar"