有没有办法用Celerity识别粗体(<b> </b>)

时间:2012-03-10 21:11:33

标签: screen-scraping celerity

我正在使用快速进行屏幕抓取,并且需要识别以粗体显示的文本元素。 Celerity提供了一种强有力的方法,但没有提供大胆的方法。有没有人用Celerity或其他工具想出一个聪明的方法。我尝试使用:

browser.html.gsub!(<b>,<strong>)
browser.html.gsub!(</b>,</strong>)

我虽然可以用强大的元素替换粗体元素,然后简单地使用celerity的强大方法,但这似乎不起作用。

提前感谢您的帮助。

1 个答案:

答案 0 :(得分:1)

b似乎很奇怪,但是你可以尝试:

browser.elements_by_xpath('//b').each do |b|
    puts "#{b} is a bold tag"
end