ImageScraper不起作用

时间:2016-04-03 09:08:56

标签: python web-scraping jupyter-notebook

好的。所以我从

下载了一个名为imagescraper的模块
Pip install ImageScraper 

在控制台中运行时

image-scraper 'insert url' 

工作得很好。但是,当我在jupyter笔记本中运行时,遵循文档。

Import image_scraper

image_scraper.scrape_images('insert url') 

我返回了一个(0,0)元组。

我已经搜索了我的图片所在的工作目录,但它不在那里。

我的好奇心不再是抓图像了。但我真的只是想解决它并解释为什么它在我的Python书中不起作用。

2 个答案:

答案 0 :(得分:1)

在ImageScraper 2.0.7中,PyPI当前提供的版本image_scraper.scrape_images()是错误的。

无法正确设置format_list,这是用于过滤图片网址的文件扩展名列表。由于默认为[],因此不会选择下载网址。

除此之外,还调用了不存在的函数,或者更准确地说,是对实际类ImageScraper方法的函数的调用。

我会避免使用它,或者您可以手动使用ImageScraper类。我看到你已经在项目作者的github页面上创建了一个问题,所以你可能想要等待结果。

答案 1 :(得分:0)

这虽然不优雅,但可以从Python内部调用非Python命令行版本的image_scraper工具:

import subprocess
import shlex
for link in your_list_of_links:
    subprocess.call(shlex.split('image-scraper ' + link))