我正在尝试使用reverse image search(它基本上是Guzzle + Symfony DOM解析器的包装器)抓取google for Goutte结果。
我在做:
$googleURL = "https://www.google.com/searchbyimage?&image_url=".$imageURL;
$crawler = $client->request('GET', $googleURL);
$client->followRedirects(true);
print_r($crawler,1);
..并且输出(https://paste.ee/p/spfYA)包含正确的网址,但body
(HTML)是默认搜索页面,没有结果。
我该怎么做才能将搜索结果作为HTML。
答案 0 :(得分:4)
我所要做的就是设置用户代理:
$client->setHeader('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/40.0.2214.111 Safari/537.36');