我正在尝试从页面中获取所有链接并删除它们,但这些链接的内容除外。该代码无法100%正常运行,因为某些lin被删除,而另一些lin无法删除。
我正在使用PHP和DOMDocument。
$dom = new DOMDocument();
$dom->encoding = 'utf-8';
$dom->loadHTML(utf8_decode($text));
$links = $dom->getELementsByTagName('a');
foreach($links as $link)
{
$link->parentNode->replaceChild(new DOMText($link->textContent), $link);//I've tried this way but not work.
//And I've tried other way below:
/*$sibling = $link->firstChild;
do {
$next = $sibling->nextSibling;
$link->parentNode->insertBefore($sibling, $link);
} while ($sibling = $next);
$link->parentNode->removeChild($link);*/
}
return $dom->saveHTML();
例如,我们有三个链接:
<p>Page</p>
<a href="http://domain/page/pag.php?id_pag=1481">Page1</a>
<a href="http://domain/page/pag.php?id_pag=1482">Page2</a>
<a href="http://domain/page/pag.php?id_pag=1483">Page3</a>
<p>Test</p>
结果是:
<p>Page</p>
Page1
<a href="http://domain/page/pag.php?id_pag=1482">Page2</a>
Page3
<p>Test</p>
我希望删除所有链接(不包含内容)。 有解决这个问题的主意吗?
答案 0 :(得分:1)
将$links
的副本作为普通数组进行复制,因为getElementsByTagName()
返回的对象是一个“活动的” NodeList
–在修改DOM时它会更改,这会导致foreach
循环以跳过元素(这与在循环遍历数组时尝试从数组中删除元素的问题相同。)
$links_array = [];
foreach ($links as $l) {
$links_array[] = $l;
}
foreach($links_array as $link)
{
$link->parentNode->replaceChild(new DOMText($link->textContent), $link);
}