Question

有没有办法在Nokogiri中选择节点的所有内容？

<root>
    <element>this is <hi>the content</hi> of my æøå element</element>
</root>

获取/root/element内容的结果应为：

this is <hi>the content</hi> of my æøå element

编辑：

似乎解决方案只是使用myElement.inner_html()。我遇到的问题实际上是我依赖于旧版本的libxml2，它逃脱了所有特殊字符。

Answer 1

Nokogiri.parse('<root><element>this is <hi>the content</hi> of my element</element></root>').css('element').inner_html

如果你想逃避，可以使用CGI.unescape方法：

require 'cgi'
x = Nokogiri.parse('<root><element>this is <hi>the content</hi> of my element</element></root>').css('element').inner_html
CGI.unescape(x)

Answer 2

我认为之前的答案是假设HTML。我不确定这是否合适，所以这是我的（类似）答案：

require 'nokogiri'
xml = '<root><element>this is <hi>the content</hi> of my æøå element</element></root>' 
p Nokogiri(xml).at('element').to_xml

有没有办法选择节点的所有内容？

2 个答案: