我如何使用scrapy来提取一些文本匹配的链接

时间:2012-12-14 03:33:31

标签: python scrapy

我想关注那些文本中有Next的链接,如

<div id="pagination"
<a href="#" > 1 </a>
<a href="#" > 2 </a>
<a href="#" > 3 </a>
<a href="#" > Next </a>
</div>

我怎么能这样做我scrapy。它也是最后一个选择

1 个答案:

答案 0 :(得分:1)

创建一个扩展BaseSgmlLinkExtractor的类,并提供process_value可调用,如docs

所示