我正在尝试获取一个图像列表或一个图像,它们存在于不同的xpath中,以填充此(un)security news网站的默认scrapy ImagesPipeline image_urls
,方法是使用或者xpath运算符response.xpath()
relative_urls = response.xpath('''//*[contains(@class, "rondell-container")]//img/@src |
//*[contains(@class, "itemImageBlock")]//img/@src'''
).extract()
路径可以正常使用chrome Xpath Helper扩展,但是当刮不到时,在某些情况下我没有得到图像。
我正在考虑文章甚至没有图像的情况。