标签: ruby nokogiri mechanize-ruby
我正在尝试从HTML表中抓取信息。页面上有多个表格。在每个表之前有一个带有文本的段落。我想要关闭这个文本字段(" CONSOLIDATED"下面的pastebin中的文本)来标识表,因为页面上没有DIV标记,因此没有其他方法可以唯一地标识表。我该怎么做?我会使用什么XPath语句?这是指向HTML页面的链接:http://pastebin.com/HeapZvPV
谢谢!