带有所有搜索参数的Google Crawler或Scraper

时间:2014-12-03 11:58:34

标签: php web-scraping web-crawler google-search

我有一个100万网站网址列表,我有一个关键字列表。我想用Google在这些网站上逐一搜索这些关键字;如果我发现某些东西意味着它对我来说是一个有效的URL。

我在谷歌搜索找到一些工具来做,我发现了两个。

安装完所有内容之后

https://github.com/NikolaiT/GoogleScraper我发现此刮刀不支持“as_sitesearch”作为搜索参数,因此我无法通过网站进行搜索。

第二个相同:http://jaunt-api.com/jaunt-tutorial.htm

有没有好的工具呢?

1 个答案:

答案 0 :(得分:2)

我是GoogleScraper的程序员。您可以使用' as_sitesearch'当您为100万个关键字使用关键字文件时的参数。

只需使用GoogleScraper:

GoogleScraper --mode selenium --keyword-file you-keyword.txt --proxy-file your-proxies

文件 you-keyword.txt 如下所示:

site:yourdomain.com some sneaky words site:yourdomain2.com some other words ...

查看所有帮助:

GoogleScraper --help

干杯