无法刮掉谷歌

时间:2015-02-08 06:59:40

标签: php symfony web-scraping guzzle goutte

我正在尝试使用reverse image search(它基本上是Guzzle + Symfony DOM解析器的包装器)抓取google for Goutte结果。

我在做:

$googleURL = "https://www.google.com/searchbyimage?&image_url=".$imageURL;

$crawler = $client->request('GET', $googleURL);
$client->followRedirects(true);
print_r($crawler,1);

..并且输出(https://paste.ee/p/spfYA)包含正确的网址,但body(HTML)是默认搜索页面,没有结果。

我该怎么做才能将搜索结果作为HTML。

1 个答案:

答案 0 :(得分:4)

我所要做的就是设置用户代理:

$client->setHeader('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/40.0.2214.111 Safari/537.36');