如何更改保存图像的目录,scrapy

时间:2016-02-01 15:38:30

标签: python web-scraping scrapy

我正在抓取网页上的图片。 我有几张图片列表:

list_1,list_2,list_3 

这些列表中的每一个都对应一个不同的类别,到目前为止所有图像都保存在同一目录中,即在设置文件中指定的目录

IMAGES_STORE = '/home/user/Desktop/folder1/folder2'

我想将每个列表中的图像保存在不同的forder中。

1 个答案:

答案 0 :(得分:1)

已回答herehere

基本上覆盖item_completed方法,并根据它们来自哪个列表,包含您想要保存图像的逻辑。

def item_completed(self, results, item, info):

    for result in [x for ok, x in results if ok]:
        path = result['path']
        slug = slugify(item['designer'])


        settings = get_project_settings()
        storage = settings.get('IMAGES_STORE')

        target_path = os.path.join(storage, slug, os.path.basename(path))
        path = os.path.join(storage, path)

        # If path doesn't exist, it will be created
        if not os.path.exists(os.path.join(storage, slug)):
            os.makedirs(os.path.join(storage, slug))

        if not os.rename(path, target_path):
            raise DropItem("Could not move image to target folder")

    if self.IMAGES_RESULT_FIELD in item.fields:
        item[self.IMAGES_RESULT_FIELD] = [x for ok, x in results if ok]
    return item