页面源代码显示不同的代码和检查元素显示不同的代码

时间:2017-03-20 11:30:12

标签: php curl web-scraping inspect-element view-source

当我查看带有检查元素代码的代码时,在抓取网站的同时,当我查看网站的源代码时,代码就不同了。
我想在PHP中使用curl如何获得我可以使用inspect元素看到的代码 页面通过ajax调用获取详细信息但是ajax调用中没有href href我需要获取特定页面的详细信息。

这是卷曲请求

    $login = curl_init();
    curl_setopt($login, CURLOPT_URL,www.example.com);
    curl_setopt($login, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:42.0) Gecko/20100101 Firefox/42.0');
    curl_setopt($login, CURLOPT_RETURNTRANSFER, TRUE);
    curl_setopt($login, CURLOPT_FOLLOWLOCATION, TRUE);
    curl_setopt($login, CURLOPT_SSL_VERIFYPEER, FALSE);
    curl_setopt($login, CURLOPT_TIMEOUT, 40000);
    $html = curl_exec ($login);

2 个答案:

答案 0 :(得分:0)

查看页面来源=“服务器端HTML代码”

Inspect Element =“客户端HTML代码”

它们不会完全相同。 Inspect元素可以根据客户进行更改。

答案 1 :(得分:0)

你可以使用Phantom JS。它是一个可编写脚本的无头Web浏览器。它基于Web工具包,支持许多Web标准。它可用于截取屏幕截图,检查页面元素。它可以从Php调用,因此您应该能够以与检查浏览器开发人员工具箱中的页面元素相同的方式检查Php中的页面元素。此链接显示如何使用Php中的Phantom JS:https://github.com/jonnnnyw/php-phantomjs