使用post方法,coockie和验证码在php中进行Web抓取

时间:2016-04-08 06:09:38

标签: php web-scraping

我正在尝试从http://iunlocker.net/check_imei.php这个链接中删除一些数据。

此页面上包含post方法和验证码,它也使用cookie。我刚刚制作了检查元素并检入了网络,Cookie正在设置标题

请有人告诉我,我在代码中犯了什么错误?

$ch = curl_init();
$imei="013977000272744";

curl_setopt($ch,     CURLOPT_URL,"http://iunlocker.net/check_imei.php");
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_VERBOSE, 1);
curl_setopt($ch, CURLOPT_COOKIE,'_ym_uid=1460051101134309035;  _ym_isad=1; cxx=80115415b122e7c81172a0c0ca1bde40; _ym_visorc_20293771=w');
curl_setopt($ch, CURLOPT_POSTFIELDS,array(
    'imei'=>$imei,      
     ));

curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);

$server_output = curl_exec ($ch);
echo $server_output;

curl_close ($ch); 

示例IMEI 013977000272744用于手动检查。

1 个答案:

答案 0 :(得分:0)

您正确地注意到该页面有一个CAPTCHA但您没有在POST数据中包含它的响应(它将是g-recaptcha-response)。但是CAPTCHAs的重点在于你必须要成为一个人来解决它们,所以除非你设置你的脚本以将CAPTCHA传递给人来解决这个问题,否则它不会起作用。