使用Nokogiri::HTML(existing_html)
解析现有HTML,并在对其执行某些操作后,Nokogiri返回此输出:
<!DOCTYPE html>
<html>
<body>
<p>["\n", "\n", " </p>
\n", "
<meta http-equiv='\"Content-Type\"' content='\"text/html;' charset='UTF-8\"'>
\n", "
<title>My Html</title>
\n", " \n", " \n", "
<div valign='\"top\"'>
\n", "
<div class='\"myclass\"'>
\n", "
<div class='\"content\"' style='\"white-space:' pre-wrap>\n", " <img src="%5C%22MyImageSource%5C%22">\n", " </div>
\n", "
</div>
\n", " \n", ""]
</body>
</html>
我希望删除多余的空格和'\ n'字符。所以假设它存储在result
变量中,我尝试了result.to_s.gsub(/\n/, '')
和result.to_s.gsub(/\n/, '').strip
,但我得到了同样的东西。
如何删除额外空格和“\ n”?另外我很想知道它为什么会被添加?
如果需要任何代码来告诉我如何获得结果,请告诉我。