Scrapy中是否有一种方法可以不遵循指向图像的<a>
标签?
例如:
<a href="http://jamsphere.com/wp-content/uploads/2015/11/Franki-Dennull-PROFILE.jpg">
此刻我的代码:
for a in set(response.xpath('//a/@href')):
yield scrapy.Request(url, callback=self.parse)
很明显,我可以添加一个硬编码的检查,但是想知道是否有内置选项吗?