我目前正在尝试使用PHP中的cURL来抓取这个网站。
在实际查看数据之前,似乎需要确认页面。在确认页面上有一个表格发布到/includes/disclaimer.php,帖子变量为
dislcaimer_action =我同意
我已经尝试了以下代码,但第二个请求似乎总是让我回到确认页面。
$browser = curl_init();
curl_setopt($browser, CURLOPT_URL, "http://wateroffice.ec.gc.ca/include/disclaimer.php");
curl_setopt($browser ,CURLOPT_RETURNTRANSFER, true);
curl_setopt($browser, CURLOPT_HEADER, true);
curl_setopt($browser, CURLOPT_FOLLOWLOCATION, 1);
$postData = 'disclaimer_action=I Agree';
curl_setopt($browser, CURLOPT_POST, count($postData));
curl_setopt($browser, CURLOPT_POSTFIELDS, $postData);
curl_setopt($browser, CURLOPT_URL, "http://wateroffice.ec.gc.ca/report/report_e.html?mode=Table&type=realTime&stn=02HD006&dataType=&startDate=2014-09-22&endDate=2014-09-29&prm1=46&prm2=-1");
$output = curl_exec($browser);
不确定我做错了什么。提前谢谢!
答案 0 :(得分:0)
你应该将POSTFIELDS作为一个关联数组传递,就像使用$_POST['disclaimer_action']
一样,但在某种程度上不能。
$postData = array('disclaimer_action' => 'I Agree');
curl_setopt($browser, CURLOPT_POSTFIELDS, $postData);