如何打印外部网页的元标记?

时间:2018-06-08 12:09:30

标签: php dom

代码应显示所有带有标记" meta"的html行。它为什么不显示它?     

    $html = 'http://www.google.es/';

    $doc = new DOMDocument();
    $doc->loadHTML(file_get_contents("$html"));
    $items = $doc->getElementsByTagName("meta");
    if($items->length > 0){
        echo $items->item(0)->nodeValue;
    }

2 个答案:

答案 0 :(得分:1)

试试这样。请注意,Xpath查询可能会更快,因为您不需要手动遍历每个meta标记。

$html = '<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <meta http-equiv="X-UA-Compatible" content="ie=edge">
    <title>Document</title>
</head>
<body>

</body>
</html>';

$doc = new DOMDocument();
$doc->loadHTML($html);
$items = $doc->getElementsByTagName("meta");
if($items->length > 0){
    echo $items->item(0)->getAttribute('charset'); // echoes "UTF-8"
}

请点击此处:https://3v4l.org/ZFHuu

答案 1 :(得分:1)

以下是Loek提到的Xpath表达式的示例:

$document = new DOMDocument();
$document->loadHTML($html);
$xpath = new DOMXpath($document);

$charset = $xpath->evaluate('string(//meta/@charset)');
var_dump($charset);

输出:

string(5) "UTF-8"

如果此处没有带有meta属性的charset元素,则返回的值将为空字符串。