如何从使用CloudFlare的网站获取HTML数据?

时间:2019-07-27 03:59:45

标签: php curl

首先,对不起我的英语不好。

我正在尝试从https://www.uasd.edu.do/获取HTML代码,但是当我尝试使用PHP函数“ file_get_contents()”或使用cURL捕获代码时,它根本无法工作。

使用“ file_get_contents()”返回403 HTTP错误。使用cURL时,它会返回虚构的验证码,但不会出现。

我尝试通过cURL发送Cookie,设置了用户代理,但我仍然处于同一点。我也试图找到该站点的真实IP地址,但没有成功。请帮我!我真的很感激。

代码:

    $curl = curl_init(); 

    if (!$curl) {
        die("Is not working"); 
    }

    curl_setopt($curl, CURLOPT_URL, "https://uasd.edu.do/");
    curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:64.0) Gecko/20100101 Firefox/64.0'); 
    curl_setopt($curl, CURLOPT_FOLLOWLOCATION, true); 
    curl_setopt($curl, CURLOPT_FAILONERROR, true); 
    curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($curl, CURLOPT_CONNECTTIMEOUT, 10);
    curl_setopt($curl, CURLOPT_TIMEOUT, 50);
    curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false); 
    curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false); 
    $html = curl_exec($curl); 

    echo $html;
    curl_close($curl);

输出:

  

请启用cookie。进一步的步骤,请完成安全性   检查以访问www.uasd.edu.do为什么必须完成验证码?

     

完成验证码可证明您是人,并为您提供了临时服务   访问网络媒体资源。我该怎么做才能防止这种情况   未来?

     

如果您处于个人关系(例如在家),则可以运行   在您的设备上进行防病毒扫描,以确保未感染   恶意软件。

     

如果您在办公室或共享网络中,可以询问网络   管理员在网络上运行扫描以查找   设备配置错误或受感染。

     

Cloudflare射线ID:4fcbf50d18679f88•您的IP: •   Cloudflare的性能和安全性

注意:“请启用cookie” 出现在使用和不使用cookie的情况。

0 个答案:

没有答案