我有一个包含我要提取的ahref链接的文档。我想要的链接可以通过链接到的网址的一部分来识别。还有其他类似的链接,我想丢弃。
我想要的链接的网址格式为
http://www.xxxxxxxxxxxxxxxxxxx.com/index.php?showtopic=44&hl=
我想搜索包含h1 =的链接。这可能吗?
答案 0 :(得分:2)
您可以在文档的A-tag集上执行正常的find
。
document.search('a').find {|link| link['href'].include? 'h1='}