xpath查询不返回数据

时间:2015-05-22 23:00:53

标签: php xpath scrape

我试图找出如何从网页上的特定div获取属性,但我的查询并未返回任何内容。我假设我的查询错了。

我试图从这个div中获取数据原始网址:

<div 
class="p-dynamic-image vox-lazy-load lazy-loaded” 
data-original="https://cdn2.vox-cdn.com/thumbor/Bv7HhgyCscPLXrx2qHPzo8dlU4g=/0x0:7015x4677/2050x1367/cdn0.vox-cdn.com/uploads/chorus_image/image/46369294/RzrFirefly_01_DA.0.0.jpg” 
style="background-image: url(https://cdn2.vox-cdn.com/thumbor/Bv7HhgyCscPLXrx2qHPzo8dlU4g=/0x0:7015x4677/2050x1367/cdn0.vox-cdn.com/uploads/chorus_image/image/46369294/RzrFirefly_01_DA.0.0.jpg);">
</div>

我的代码:

$xpath = new DOMXpath($page_dom);
$image = $xpath->query("//div[@class='p-dynamic-image vox-lazy-load lazy-loaded']/@data-original")->value;
echo $image . "<br />";

但这不会返回任何内容。

我做错了什么?

2 个答案:

答案 0 :(得分:2)

事实上,它应该是:

<?php

$html_string ='<div 
class="p-dynamic-image vox-lazy-load lazy-loaded"
data-original="https://cdn2.vox-cdn.com/..." style="...">
</div>';

$dom = new DomDocument();
@$dom->loadHTML($html_string);
$xpath = new DOMXPath($dom);

echo $xpath->query(
    '//div[@class="p-dynamic-image vox-lazy-load lazy-loaded"]/@data-original')
        ->item(0)->value; // https://cdn2.vox-cdn.com/...

答案 1 :(得分:0)

编辑:

好的尝试使用它(使用查询而不是xpath)

$xpath = new DOMXpath($page_dom);

$results=$xml->query("//div[@class='p-dynamic-image vox-lazy-load lazy-loaded']/@data-original")->value;

foreach ($results as $image) {
    echo $image;

 }

再次编辑:请注意您之前使用的方法适用于SimpleXML,但对于DOM,您似乎需要在foreach中执行此操作