删除HTML </script>的<script>元素

时间:2009-12-30 15:50:13

标签: html css xpath nokogiri

我正在使用Ruby,使用Nokogiri模块,我想获得没有脚本元素的正文内容。

Nokogiri解析使用XPATH或CSS 3.0。 XPATH我真的不明白,我找不到CSS选择器来实现我的目标。

1 个答案:

答案 0 :(得分:8)

我不认为使用XPath可以进行这样的选择。

我不熟悉Ruby或Nokogiri,但基于answers to a similar question,您可能想尝试从HTML文档中选择所有脚本元素并将其删除。

doc = Nokogiri::HTML(your_html)
doc.xpath("//script").remove

相应调整。