如何使用Ruby gem Mechanize获取某些属性(例如colspan)的HTML标记内的内容?

时间:2012-11-16 21:12:37

标签: ruby mechanize

以下是HTML的示例:

<td colspan="3">TARGET</td>
<td>NOT TARGET</td>

如何使用Ruby的Mechanize gem仅使用<td>定位colspan="3"

1 个答案:

答案 0 :(得分:1)

Mechanize依靠HTML / XML解析器Nokogiri来处理繁重的工作。

通常我们使用agent作为Mechanize的变量。针对本地gem server进行测试,这将获得已解析文档的实例,并允许我提取节点及其参数:

page = agent.get('http://0.0.0.0:8808/')
page.at('a')

如果我想要该节点的文本内容:

page.at('a').text
# => "abstract"

在您的情况下,使用page.at('td[colspan="3"]').text获取内容。