我正在使用Ruby,使用Nokogiri模块,我想获得没有脚本元素的正文内容。
Nokogiri解析使用XPATH或CSS 3.0。 XPATH我真的不明白,我找不到CSS选择器来实现我的目标。
答案 0 :(得分:8)
我不认为使用XPath可以进行这样的选择。
我不熟悉Ruby或Nokogiri,但基于answers to a similar question,您可能想尝试从HTML文档中选择所有脚本元素并将其删除。
doc = Nokogiri::HTML(your_html)
doc.xpath("//script").remove
相应调整。