DOMDocument用fragment替换nodeValue文本

时间:2016-01-03 09:01:02

标签: php html domdocument

我想用DOM元素片段替换DOMNode中的文本。

例如,给定此HTML字符串:

<p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.</p>

我想替换“ dolor sit amet ”,用HTML元素包装它。

导致类似:

<p>Lorem ipsum <em>dolor sit amet</em>, consectetuer adipiscing elit.</p>

我可以使用以下内容向元素追加一个新片段:

$doc = new DOMDocument();
$paragraph = $doc->appendChild($doc->createElement('p', 'Lorem ipsum dolor sit amet, consectetuer adipiscing elit.'));
$fragment = $doc->createDocumentFragment();
$fragment->appendXML('<em>dolor sit amet</em>');
$paragraph->appendChild($fragment);

但是,这会在段落中添加一个新元素。我似乎无法用另一个HTML元素替换段落中的文本,我只能将元素追加到最后。

我也试过这种方法:

$paragraph->nodeValue = str_replace($searchtext, $doc->saveXML($fragment), $paragraph->nodeValue);

但是,在输出中会导致段落值中的转义HTML元素(&lt;em&gt;等...)而不是正确的HTML元素。

如何用HTML元素替换文本内容或节点值?

赞赏的想法!

2 个答案:

答案 0 :(得分:1)

无需创建单独的元素,您可以使用preg_replace函数搜索特定模式并将其替换为您的字符串,如下所示:

$str = "<p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.</p>";

$doc = new DomDocument();
$doc->loadHTML($str);
$paragraph = $doc->getElementsByTagName('p')->item(0);
$modified_string = preg_replace('/dolor sit amet/', '<em>dolor sit amet</em>', $paragraph->textContent);
echo $modified_string;

输出:

enter image description here

以下是参考资料:

<强>编辑:

$str = "<p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.</p>";

$doc = new DomDocument();
$doc->loadHTML($str);
$paragraph = $doc->getElementsByTagName('p')->item(0);
$paragraph->nodeValue = preg_replace('/dolor sit amet/', '<em>dolor sit amet</em>', $paragraph->textContent);
$str = htmlspecialchars_decode($doc->saveHtml());
echo $str;

答案 1 :(得分:1)

好的,经过进一步测试,我实际上找到了一个解决方案,用DOMDocument中新的有效HTML元素替换文本内容。

示例代码如下:

$doc = new DOMDocument();
// Create sample paragraph element
$paragraph = $doc->appendChild($doc->createElement('p', 'Lorem ipsum dolor sit amet, consectetuer adipiscing elit.'));
// Create example replacement insert element
$element = $doc->createElement('em', 'dolor sit amet');
// Create element fragment to insert
$fragment = $doc->createDocumentFragment();
// Get new paragraph value
$new_value = str_replace('dolor sit amet', $doc->saveXML($element), $paragraph->nodeValue);
// Add new paragraph value as fragment
$fragment->appendXML('<p>' . $new_value . '</p>');
// Replace paragraph element with new valid fragment
$paragraph->parentNode->replaceChild($fragment, $paragraph);

结果:

<p>Lorem ipsum <em>dolor sit amet</em>, consectetuer adipiscing elit.</p>

希望这有助于未来的读者。