如何使用Mechanize从html页面上的'table'标签中的'td'标签中获取文本

时间:2012-04-03 19:47:28

标签: ruby mechanize

如何使用Mechanize gem从html页面上的'table'获取'td'标签中的文本?

1 个答案:

答案 0 :(得分:2)

我几乎总是使用nokogiri机械化。这个guide帮助我开始了。

这样的事情应该有效(未经测试):

require 'mechanize'
require 'nokogiri'

agent = Mechanize.new
page = agent.get("http://www.google.com/")
doc = Nokogiri::HTML(page.body, "UTF-8")
doc.xpath('//td').each do |node|
  puts node.text
end

有关nokogiri的更多信息here