我正在使用快速进行屏幕抓取,并且需要识别以粗体显示的文本元素。 Celerity提供了一种强有力的方法,但没有提供大胆的方法。有没有人用Celerity或其他工具想出一个聪明的方法。我尝试使用:
browser.html.gsub!(<b>,<strong>)
browser.html.gsub!(</b>,</strong>)
我虽然可以用强大的元素替换粗体元素,然后简单地使用celerity的强大方法,但这似乎不起作用。
提前感谢您的帮助。
答案 0 :(得分:1)
b似乎很奇怪,但是你可以尝试:
browser.elements_by_xpath('//b').each do |b|
puts "#{b} is a bold tag"
end