Python 3.6-使用Google图片下载进行图片抓取

时间:2019-01-02 14:29:13

标签: python selenium web-scraping selenium-chromedriver

我想为我的The SDK directory is not writable (/usr/local/android-sdk)练习抓取一些图像,并发现此google-image-download非常有用,并且代码开箱即用。

但是,目前,它最多只能容纳100张图片,这是google图片页的限制(每页只能加载100张图片)。

该文档说,如果您使用的是machine learning(在我的情况下,我正在这样做),它将与pip install google_images_download一起下载,并且通过使用selenium,您可以下载更多超过该限制。

但是,每次我运行代码chromedriver

python gimages.py

我会收到错误消息:

  

看起来我们无法找到“ chromedriver”路径(使用   '--chromedriver'参数指定可执行文件的路径。)或   您的计算机上未安装google chrome浏览器(例外:   预期的str,字节或os.PathLike对象,而不是NoneType)

在我检查安装情况时,from google_images_download import google_images_download response = google_images_download.googleimagesdownload() arguments = {"keywords":"number plates","limit":200,"print_urls":True} paths = response.download(arguments) print(paths) 已安装: enter image description here

  1. 进一步阅读,它说我可以下载selenium并放在相同的文件夹中,然后调用chromedriver,我仍然遇到相同的错误。

我该如何解决?

我将python gimages.py --chromedriver "chromedriver"conda一起使用,并从conda运行python 3.6。该代码已经在工作,只是terminal部分没有工作。

1 个答案:

答案 0 :(得分:0)

您需要指定路径... "chromedriver"不是路径...

您可能需要使用显式路径"/path/to/chromedriver/folder"

您的情况:python gimages.py --chromedriver "/path/to/chromedriver/folder"

希望这对您有帮助!