防止Nokogiri在URL中转义字符

时间:2011-12-14 22:59:31

标签: nokogiri

Nokogiri("<a href='*|UNSUB|*'>unsubscribe</a>").to_html
# returns
"<a href="*%7CUNSUB%7C*">unsubscribe</a>"

如何让Nokogiri逃脱管道?

1 个答案:

答案 0 :(得分:1)

require 'nokogiri'

doc = Nokogiri("<a href='*|UNSUB|*'>unsubscribe</a>")

puts doc.to_html
#=> <a href="*%7CUNSUB%7C*">unsubscribe</a>

puts doc.to_xml
#=> <?xml version="1.0"?>
#=> <a href="*|UNSUB|*">unsubscribe</a>

可替换地:

puts doc.to_html.gsub('%7C','|')
#=> <a href="*|UNSUB|*">unsubscribe</a>