更改Scrapy上图片管道的CSV结果

时间:2018-10-26 00:46:23

标签: scrapy scrapy-pipeline

我正在使用默认的Scrapy Images管道,并且将数据导出为CSV。最后一个字段会自动填充一个包含原始url,本地路径和校验和的数组。但是,我只需要一个包含本地路径的字符串即可。我该怎么办?

1 个答案:

答案 0 :(得分:1)

我猜你正在得到类似的结果

item["images"] = [
  {'checksum': '2b00042f7481c7b056c4b410d28f33cf',
   'path': 'full/0a79c461a4062ac383dc4fade7bc09f1384a3910.jpg',
   'url': 'http://www.example.com/files/product1.pdf'}]

在您的process_item()管道方法中,执行此操作

def process_item(self, item, spider):

    images = item["images"]
    del item["images"]

    item['path'] = []
    for k,v in images.iteritems():
        item['path'].extend([v['path']])