如何使用php simple html dom在href中获取“name”或“id”属性。我还需要“h4”标签内的“标题文字”。 请你帮助我好吗? 这是html:
<td>
<a href="../Vehicle?itemID=22995061&RowNumber=9&loadRecent=True" name="22995061" id="22995061">
<h4>title text</h4>
</a>
<p>
Stock#:
<text>example</text>
</p>
<p>BLA BLA</p>
<p> fffff </p>
</td>
我尝试过类似的东西,但它让我空白。
IDs = array();
$url = "http://someurl";
$html = file_get_html(url);
foreach($html->find('h4') as $e)
{
echo $e->innertext."<br>";
$dataID = $e->innertext;
$IDs[] = $dataID;
}
答案 0 :(得分:0)
首先,改变,
IDs = array();
要,
$IDs = array();
然后,为什么不使用DOMDocument
类而不是正则表达式。只需加载您的DOM,然后使用getElementsByTagName
获取您的代码。通过这种方式,您可以排除您不想要的任何其他标记,并且只能获取您所做的标记。
示例强>
<?php
$xml = <<< XML
<?xml version="1.0" encoding="utf-8"?>
<books>
<book>Patterns of Enterprise Application Architecture</book>
<book>Design Patterns: Elements of Reusable Software Design</book>
<book>Clean Code</book>
</books>
XML;
$dom = new DOMDocument;
$dom->loadXML($xml);
$books = $dom->getElementsByTagName('book');
foreach ($books as $book) {
echo $book->nodeValue, PHP_EOL;
}
?>
阅读材料