标签: python scrapy
我想关注那些文本中有Next的链接,如
<div id="pagination" <a href="#" > 1 </a> <a href="#" > 2 </a> <a href="#" > 3 </a> <a href="#" > Next </a> </div>
我怎么能这样做我scrapy。它也是最后一个选择
答案 0 :(得分:1)
创建一个扩展BaseSgmlLinkExtractor的类,并提供process_value可调用,如docs
BaseSgmlLinkExtractor
process_value