如何使用node.js和cheerio来刮取谷歌图像

时间:2015-10-28 05:13:51

标签: javascript node.js web web-scraping cheerio

有谁知道如何使用节点和cheerio从谷歌刮图像?我曾尝试使用cheerio从像reddit.com或黄色pages.com这样的网站上抓取图片,但它运行正常。但是我怎么能够在谷歌图像下放入搜索查询并刮掉图像呢?例如,我对“猫”进行了查询并使用了cheerio,我将google图像下的所有url返回给“cats”。

1 个答案:

答案 0 :(得分:0)

查看此库https://github.com/vdemedes/node-google-images,它似乎直接使用google的api https://github.com/vdemedes/node-google-images/blob/master/lib/google-images.coffee#L31,而不是加载页面的浏览器版本并尝试以这种方式抓取图像。我猜测/图像中存在一些沉重的javascript技巧,这使得下载图像变得困难。我建议使用我链接的库。