任何人都知道如何刮刮谷歌图像的结果?我只是想在网址上使用简单的html dom类,并将搜索词放入,但我真的不知道该怎么做。
如果有人能提供帮助那就太棒了。
由于
答案 0 :(得分:11)
Google提供图片搜索API:http://code.google.com/apis/imagesearch/。在尝试尽可能使用屏幕抓取之前,您应该尝试使用提供程序API。
修改强>: 根据CrizCraig的评论,Google图片搜索API已被弃用,但您现在可以使用他们的Custom Search API进行图片搜索。
答案 1 :(得分:1)
Googles Search API每天仅限于100次搜索(所有用户),因此完全没有价值。如果您有100,000个用户,那么每天只有前100个搜索工作,然后其他99,900个用户在第二天之前就不运气了。毫无价值,毫无价值,毫无价值...... -rrh
答案 2 :(得分:0)
检查此Scrape-google-image-results-php项目代码
https://github.com/ch-hassansaeed/Scrape-google-image-results-php
答案 3 :(得分:0)
请检查这个 PHP 搜索图像爬虫。这从 Google 和/或 Bing 获取图片
答案 4 :(得分:0)
您可以使用第三方解决方案,例如 SerpApi。这是一个免费试用的付费 API。每次搜索以 100 张图片为一组提取图片。
示例 Python 代码(也可在其他库中使用):
from serpapi import GoogleSearch
params = {
"engine": "google",
"q": "apple",
"google_domain": "google.com",
"tbm": "isch",
"api_key": "secret_api_key"
}
search = GoogleSearch(params)
results = search.get_dict()
示例 JSON 输出:
"images_results": [
{
"position": 1,
"thumbnail": "https://serpapi.com/searches/60c7b8741071f4f513abd052/images/9d5937802258877e859be4dd3b7b225b4bdda702a3ab50dfa9b93a8b6d1c07b5.png",
"source": "en.wikipedia.org",
"title": "History of Apple Inc. - Wikipedia",
"link": "https://en.wikipedia.org/wiki/History_of_Apple_Inc.",
"original": "https://upload.wikimedia.org/wikipedia/commons/f/fa/Apple_logo_black.svg"
},
...
]
您可以查看documentation了解更多详情。
免责声明:我在 SerpApi 工作。