使用php curl从具有多个提交的网站中提取数据

时间:2012-08-17 12:48:21

标签: php html curl extract

我必须通过多个提交从网站提取数据,这必须自动完成......流程如下......

  1. 转到此页... http://www.licindia.in/premium_calculator.htm。
  2. 选择一些内容然后提交。这将带我到一个表格
  3. 填写表格并提交......
  4. 获取生成的html。并提取数据。
  5. 我之前使用过curl来远程登录网站,但我似乎无法让它正常工作。

    $url="http://www.licindia.in/premium_calculator.htm";
    $postdata = "thepostdata"
    $cookie = "cookie.txt" ;
    $ch = curl_init(); 
    curl_setopt ($ch, CURLOPT_URL, $url); 
    curl_setopt ($ch, CURLOPT_SSL_VERIFYPEER, true);
    curl_setopt ($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:13.0) Gecko/20100101 Firefox/13.0");
    curl_setopt($ch,CURLOPT_COOKIESESSION,false); 
    curl_setopt ($ch, CURLOPT_TIMEOUT, 60); 
    curl_setopt ($ch, CURLOPT_FOLLOWLOCATION, 1); 
    curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);  
    curl_setopt ($ch, CURLOPT_REFERER, $referer);
    curl_setopt ($ch, CURLOPT_COOKIEJAR, $cookie);
    curl_setopt ($ch, CURLOPT_POSTFIELDS, $postdata); 
    curl_setopt ($ch, CURLOPT_POST, 1); 
    $result = curl_exec ($ch);
    curl_close($ch);
    

    我尝试过这样的东西......这不是实际的东西......但这是类似的

1 个答案:

答案 0 :(得分:1)

我认为您的第一个问题是,您链接的网页上的表单实际上是从iframe加载的。

您需要使用该iframe的网址,因为cURL不会从父网页加载iframe srouce。