使用此代码:
doc = Nokogiri::HTML(open("text.html"))
doc.xpath("//span[@id='startsWith_']").remove
我想从span#id
开始选择每个'startsWith_'
并将其删除。我试着搜索,但失败了。
答案 0 :(得分:1)
以下是一个例子:
require 'nokogiri'
html = '
<html>
<body>
<span id="doesnt_start_with">foo</span>
<span id="startsWith_bar">bar</span>
</body>
</html>'
doc = Nokogiri::HTML(html)
p doc.search('//span[starts-with(@id, "startsWith_")]').to_xml
这就是如何选择它们。
doc.search('//span[starts-with(@id, "startsWith_")]').each do |n|
n.remove
end
这就是删除它们的方法。
p doc.to_xml
# >> "<span id=\"startsWith_bar\">bar</span>"
# >> "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\" \"http://www.w3.org/TR/REC-html40/loose.dtd\">\n<html><body>\n <span id=\"doesnt_start_with\">foo</span>\n \n</body></html>\n"
页面“XPath, XQuery, and XSLT Functions”包含可用功能列表。
答案 1 :(得分:0)
试试这个xpath表达式:
//span[starts-with(@id, 'startsWith_')]