我的文档在这样的文档中包含一堆div:
<div>
<h5>sometitle</h5>
<ul>
<li><a href="someurl1">link1</a></li>
<li><a href="someurl2">link2</a></li>
<li><a href="someurl2">link3</a></li>
</ul>
</div>
我希望检索标题和每个href值。
我尝试过这样的事情:
$dom = new DOMDocument();
@$dom->loadHTML($html);
$divs = $dom->getElementsByTagName('div');
foreach($divs AS $div){
echo $div->getElementsByTagName('h5')->nodeValue; //this doesnt work
}
但是
$div->nodeValue;
返回标题和每个链接文本。我在这里错过了什么?提前谢谢!
答案 0 :(得分:2)
getElementsByTagName
返回DOMNodeList,您需要第一个节点:
echo $div->getElementsByTagName('h5')->item(0)->nodeValue;