如何使用nokogiri将&
保存在最终的xml文件中?
我的代码就像:
require 'rubygems'
require 'nokogiri'
file_name = "amp.xml"
@doc = Nokogiri::XML('<project/>')
arg = Nokogiri::XML::Node.new "arg", @doc
arg['line'] = "how to save only &???"
@doc.root.add_child(arg)
File.open(file_name, 'w') {|f| f.write(@doc.to_xml) }
,输出就像
<?xml version="1.0"?>
<project>
<arg line="how to save only &???"/>
</project>
看起来我可以使用CDATA,但不知道如何将它与nokogiri一起使用。我使用@doc = Nokogiri::XML(File.open(file_name))
答案 0 :(得分:3)
您无法根据需要将未转义的&
放入XML中。这是来自W3 spec for XML:
&符号(&amp;)和左尖括号(&lt;)绝不能以字面形式出现,除非用作标记分隔符,或用于注释,处理指令或CDATA部分。如果在其他地方需要它们,则必须使用数字字符引用或字符串“&amp;”和“&lt;”分别进行转义。
至于在Nokogiri的网站上使用CDATA,here is info来自Nokogiri的网站,如果你使用Nokogiri :: XML :: Builder来构建你的XML。
更新:这是我在评论中提到的示例中的代码。
module Questions
@source = File.dirname(__FILE__) + '/questions.xml'
def parse
if File.exists?(@source)
File.open(@source, 'r+') do |document|
q = {}
text = Nokogiri::XML::Document.parse(document)
text.xpath('.//question').each do |c|
parent = c.attribute_nodes[2].to_s
q[:type] = c.attribute_nodes[1].to_s.to_sym # => question type
q[:q_id] = c.attribute_nodes[0].to_s # => question type
q[:question] = c.xpath('.//q').first.content # => question
q[:answers] = []
c.xpath('.//a').each { |ans|
p = ans.attribute_nodes.first.value # => point value
a = ans.content # => answer
q[:answers] << [a, p]
}
if parent == "NA"
Question.create!(q)
else
Question.first(conditions: {q_id: parent}).children << Question.create!(q)
end
end
end
end
end
def write
builder = Nokogiri::XML::Builder.new do |xml|
xml.root {
Question.each do |t|
xml.question(id: t.id, type: t.type, parent: t.parent) {
xml.q_ t.q
t.answers.each { |c|
xml.a(point: c.p) { xml.text c.a }
}
}
end
}
end
document = builder.to_xml
File.open(@source, 'w+') do |f|
f.puts document
end
end # end write
module_function :parse
module_function :write
end
---这是我正在使用的一个例子。 ---
<question id="q0000" type="root" parent="NA">
<q>How do you feel about sports?</q>
<a point="0">I don't have any interest in sports.</a>
<a point="q0001">I like to play sports.</a>
<a point="q0002">I follow college or professional sports.</a>
</question>
答案 1 :(得分:0)
我最近遇到了类似的问题。您需要使用 xml.<<
而不是 xml.text
https://www.rubydoc.info/github/sparklemotion/nokogiri/Nokogiri/XML/Builder#%3C%3C-instance_method
变化:
t.answers.each { |c|
xml.a(point: c.p) { xml.text c.a }
}
到
t.answers.each { |c|
xml.a(point: c.p) { xml << c.a }
}