我试图获取页面的HTML内容,但是当我这样做时,我的file_get_contents只返回一段JS。
当我仅使用file_get_contents时,我可以看到内容,但我也尝试使用loadHTML。因此,请使用以下功能。
function getContent(String $url): \DOMDocument
{
$opts = array(
'http' => array(
'method'=>"GET",
'header'=>"Content-Type: text/html; charset=utf-8"
)
);
$context = stream_context_create($opts);
$result = file_get_contents($url,false,$context);
$parser = new \DOMDocument();
$parser->loadHTML($result = mb_convert_encoding($result,'HTML-ENTITIES', 'ASCII, JIS, UTF-8, EUC-JP, SJIS'));
return $parser;
}
但是这次,我遇到了DOMDocument::loadHTML(): Tag header invalid in Entity
,因此我尝试使用libxml_use_internal_errors(true);
来解决这个问题,但是,我只是返回页面的JS部分...
我该如何克服问题?