删除标签<a>,但不删除内容

时间:2019-07-01 22:17:01

标签: php dom domdocument

我正在尝试从页面中获取所有链接并删除它们,但这些链接的内容除外。该代码无法100%正常运行,因为某些lin被删除,而另一些lin无法删除。

我正在使用PHP和DOMDocument。

   $dom = new DOMDocument();
   $dom->encoding = 'utf-8';
   $dom->loadHTML(utf8_decode($text));

   $links = $dom->getELementsByTagName('a');

   foreach($links as $link)
   {
       $link->parentNode->replaceChild(new DOMText($link->textContent), $link);//I've tried this way but not work.

       //And I've tried other way below:
       /*$sibling = $link->firstChild;
       do {
          $next = $sibling->nextSibling;
          $link->parentNode->insertBefore($sibling, $link);
       } while ($sibling = $next);
       $link->parentNode->removeChild($link);*/
   }
   return $dom->saveHTML();

例如,我们有三个链接:

<p>Page</p>
<a href="http://domain/page/pag.php?id_pag=1481">Page1</a>
<a href="http://domain/page/pag.php?id_pag=1482">Page2</a>
<a href="http://domain/page/pag.php?id_pag=1483">Page3</a>
<p>Test</p>

结果是:

<p>Page</p>
Page1
<a href="http://domain/page/pag.php?id_pag=1482">Page2</a>
Page3
<p>Test</p>

我希望删除所有链接(不包含内容)。 有解决这个问题的主意吗?

1 个答案:

答案 0 :(得分:1)

$links的副本作为普通数组进行复制,因为getElementsByTagName()返回的对象是一个“活动的” NodeList –在修改DOM时它会更改,这会导致foreach循环以跳过元素(这与在循环遍历数组时尝试从数组中删除元素的问题相同。)

$links_array = [];
foreach ($links as $l) {
    $links_array[] = $l;
}
foreach($links_array as $link)
{
   $link->parentNode->replaceChild(new DOMText($link->textContent), $link);
}