根据搜索字词刮取Google图片

时间:2017-07-26 16:26:03

标签: python image web-scraping beautifulsoup

我希望抓取以下网址中显示的所有图片: happiness

我尝试了很多方法,但我只能获取20张图像。下面是Python中的相同代码:

.gitconfig

有人可以帮我提取所有图片吗?

2 个答案:

答案 0 :(得分:1)

我们构建了一个解决方案to solve Google Image scraping。   SerpAPI是将Google图片结果转换为JSON的网络服务。 我们为所有最受欢迎的平台提供了扩展:Python,Ruby,Java,NodeJS等...

答案 1 :(得分:0)

Google图片仅返回20张图片,我们滚动时会加载后续结果。要控制要返回的20个结果,可以在url中使用start参数。

例如,这将打印您指定结果数量的图像网址

import requests
from bs4 import BeautifulSoup

num_res = 400
for start in range(0, num_res, 20):
    base_url ="https://www.google.co.in/search?q=happiness&source=lnms&tbm=isch&start={}"
    r = requests.get(base_url.format(start))
    soup = BeautifulSoup(r.content, 'lxml')
    print([[res.get('src') for res in child.findAll('img')] for child in soup.html.body.table.children][3])

这个答案只是为了满足您的好奇心,理想的方法是通过google search apis