从PHP url检索具有特定类名的文本

时间:2018-03-09 17:17:47

标签: php html xpath domdocument domxpath

如何从另一个具有PHP特定类名的页面获取文本属性? 我有一个像这样的网址列表

$url_array = array(
    'https://www.example.com/item/32',
    'https://www.example.com/item/33',
    'https://www.example.com/item/34'
);

这真的很难解释,所以我做了一个不那么漂亮的草图 过程:

PHP process

第一个气泡列表是$ url_array的项目,每个项目都包含不同的URL。

现在我需要一种方法来读取URL并获取其内容。 PHP将返回一个div元素,其中<a>元素带有href个网址,但每次都会有不同的网址。

现在我想从<a>元素网址获取内容。它应返回<span><p>标记文字内容,其中text-class为其自己的类。

我怎样才能将这种方法变成PHP代码? 我已经尝试了这个但它无法正常工作:

$htmlAsString = "index.php";
$doc = new DOMDocument();
$doc->loadHTML($htmlAsString);
$xpath = new DOMXPath($doc);
$nodeList = $xpath->query('//a[@class="class-name"]/@href');
for ($i = 0; $i < $nodeList->length; $i++) {
    $url_price = $nodeList->item($i)->value . "<br/>\n";
    $retrieve_text_begin = explode('<div class="text-property">', 
    $url_price);
    $retrieve_text_end = explode('</div>', $retrieve_text_begin[1]);
    echo $retrieve_text_end[0];
}

我知道$htmlAsString = "index.php";可能是问题。

0 个答案:

没有答案