Question

使用此代码：

doc = Nokogiri::HTML(open("text.html"))
doc.xpath("//span[@id='startsWith_']").remove

我想从span#id开始选择每个'startsWith_'并将其删除。我试着搜索，但失败了。

Answer 1

以下是一个例子：

require 'nokogiri'

html = '
<html>
<body>
  <span id="doesnt_start_with">foo</span>
  <span id="startsWith_bar">bar</span>
</body>
</html>'

doc = Nokogiri::HTML(html)
p doc.search('//span[starts-with(@id, "startsWith_")]').to_xml

这就是如何选择它们。

doc.search('//span[starts-with(@id, "startsWith_")]').each do |n|
  n.remove
end

这就是删除它们的方法。

p doc.to_xml
# >> "<span id=\"startsWith_bar\">bar</span>"
# >> "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\" \"http://www.w3.org/TR/REC-html40/loose.dtd\">\n<html><body>\n  <span id=\"doesnt_start_with\">foo</span>\n  \n</body></html>\n"

页面“XPath, XQuery, and XSLT Functions”包含可用功能列表。

Answer 2

试试这个xpath表达式：

//span[starts-with(@id, 'startsWith_')]

如何在Nokogiri中使用xpath选择ID？

2 个答案: