file_get_html&带有cURL的str_get_html正在获取页面的一部分

时间:2018-03-12 11:37:39

标签: php regex web-scraping file-get-contents simple-html-dom

这是一个非常奇怪的情况,我无法解释。 我使用simple HTML DOM并尝试获取此页面的完整代码:

http://ronilocks.com/

问题是,我只能获得页面上实际内容的一部分。 例如:查看页面源代码并查看plugins文件夹中的所有脚本标记。有很多。 当我用simple HTML DOMwp-rocket取回的字符串检查相同时,它们都没有。仅file_get_html()

(我也使用了干净的file_get_contents()wp-rocket并获得了相同的结果)

有什么想法? 谢谢!

编辑:@(已被废弃的页面上安装)是否可能知道该网页已被废弃并显示不同的内容?

1 个答案:

答案 0 :(得分:0)

include 'simple_html_dom.php';
$html = file_get_html('http://ronilocks.com/');
echo count($html->find('a'));
// 425

我得到425.这看起来对我来说。