使用ruby和nokogiri根据URL的一部分选择ahrefs

时间:2009-07-26 18:37:31

标签: ruby nokogiri

我有一个包含我要提取的ahref链接的文档。我想要的链接可以通过链接到的网址的一部分来识别。还有其他类似的链接,我想丢弃。

我想要的链接的网址格式为

http://www.xxxxxxxxxxxxxxxxxxx.com/index.php?showtopic=44&hl=

我想搜索包含h1 =的链接。这可能吗?

1 个答案:

答案 0 :(得分:2)

您可以在文档的A-tag集上执行正常的find

document.search('a').find {|link| link['href'].include? 'h1='}