我想拉一个网站的HTML,
我正在使用file_get_contents($url)
。
当我运行file_get_contents
时,它需要花费太多时间来拉取主机站点的html,
我可以跳过样式,脚本和图像吗?
我认为那时拉取该网站的HTML会花费更少的时间。
答案 0 :(得分:1)
尝试:
$file = file_get_contents($url);
$only_body = preg_replace("/.*<body[^>]*>|<\/body>.*/si", "", $file);