解析Simple HTML Dom中的注释

时间:2013-03-29 05:10:21

标签: php html-parsing

我可以使用Simple HTML Dom ??

获取两个html注释之间的数据

例如,请参阅以下代码:

<!-- start of comment -->

<a href="link1.html" target="_blank">link1</a><br />
<a href="link2.html" target="_blank">link2</a><br />
<a href="link3.html" target="_blank">link3</a><br />
<a href="link4.html" target="_blank">link4</a><br />


<!-- end of comment-->

<a href="link5.html" target="_blank">link5</a><br />
<a href="link6.html" target="_blank">link6</a><br />

共有六个链接,只有4个链接包含在“”和“”标记内。

我只想获得评论标签之间的链接。

2 个答案:

答案 0 :(得分:1)

试试此代码

$dom = new DOMDocument();
$dom->loadHTML($html);

$elements = $dom->getElementsByTagName('a');
foreach ($elements as $child) {
    echo $child->nodeValue;
}

答案 1 :(得分:0)

你可以这样做:

//get all comments
$comments = $html->find('comment');

...并使用next_sibling()获取下一个元素并检查它是否为锚标记,直到您获得另一个注释标记,然后脚本将终止。