我已将URL张贴到我在家庭服务器上创建的Feed中,以从网站获取该URL的所有元数据。
我抓取的网站是uk.yahoo.com。我已经发布了该链接,知道它实际上有一个og:该URL下该页面的元。
<meta property="og:image" content="https://s.yimg.com/dh/ap/default/130909/y_200_a.png">
<meta name="description" content="News, email....">
<meta property="og:title" content="Yahoo">
当我查看控制台时,它说该数组为空
libxml_use_internal_errors(true); //
$doc = new DomDocument();
$doc->loadHTML($html);
$xpath = new DOMXPath($doc);
$query = '//*/meta[starts-with(@property, \'og:\')]';
$metas = $xpath->query($query);
$rmetas = array();
foreach($metas as $meta) {
$property = $meta->getAttribute('property');
$content = $meta->getAttribute('content');
$rmetas[$property] = $content;
}
var_dump($rmetas);
然后我发布了news.yahoo.com链接,它得到了所有的og:meta完美。