Goutte / Symfony DOM Crawler从表单下载文件

时间:2018-08-23 04:51:46

标签: web-scraping web-crawler screen-scraping goutte domcrawler

远程页面中有一个表单,提交后,该表单会自动将特定文件下载到您的计算机中。如何使用Goutte或本机Symfony DOM爬网程序抓取该文件并将其存储在服务器上?

当前我有以下代码:

    $client = new Client();
    $client->setHeader('user-agent', "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36");

    $crawler = $client->request('GET', 'ADDRESS');
    $form = $crawler->selectButton('Get Results')->form();
    $crawler = $client->submit($form);

如果Goutte不允许这样做,哪种技术可以?

0 个答案:

没有答案