如何使用Mechanize gem从html页面上的'table'标签获取'td'标签内的所有文本?

时间:2010-11-24 10:27:46

标签: ruby mechanize

我正在尝试使用Mechanize gem解析表,但我不知道如何迭代表。

1 个答案:

答案 0 :(得分:2)

Mechanize使用nokogiri来解析HTML,因此您应该在那里查找文档。也就是说,看看xpath方法。

以下是解析当前页面的示例:

require 'open-uri'
require 'nokogiri'
doc = Nokogiri::HTML(open('http://stackoverflow.com/questions/4265745/how-to-get-all-text-inside-td-tags-from-table-tag-on-html-page-using-mechaniz'))
table = doc.xpath('//table').first # getting the first table on the page
table.xpath('tr/td').count # getting all the td nodes right below table/tr and counting them
#=> 4