PHP - DomXPath空标记

时间:2016-09-02 20:18:49

标签: php domxpath

我有一个HTML文字。

$htmlString = '
<span class="title">Random title</span>
Lorem ipsum dolor sit amet, consectetur adipisicing elit. Labore aperiam aut iusto quae error tempore nisi consequuntur natus magni fugiat illum, repellat minima quibusdam aliquam dolor deserunt repudiandae quas, laboriosam.
<div class="title">Title with missing <i></i><i></i><i></i><i></i></div>
Lorem ipsum dolor sit amet, consectetur adipisicing elit. Labore aperiam aut iusto quae error tempore nisi consequuntur natus magni fugiat illum, repellat minima quibusdam aliquam dolor deserunt repudiandae quas, laboriosam.
';

从这个html我想要的每一个 用'title'类标记。所以我这样做了:

$document = new DOMDocument();
$document->loadHTML($htmlString);

$finder = new DomXPath($document);
$elements = $finder->query("//*[contains(concat(' ', @class, ' '), ' title ')]");

foreach($elements as $index => $element) {
    echo $element->ownerDocument->saveXML( $element ) . PHP_EOL;
}

它运行良好,但如果有一个空标签 文本内部无法正常工作。

您可以看到空<i></i>标签变为</i>。我需要带有空标签的文本。 所以我把我的代码更改为:

$document = new DOMDocument();
$document->loadHTML($htmlString);

$finder = new DomXPath($document);
$elements = $finder->query("//*[contains(concat(' ', @class, ' '), ' title ')]");

foreach($elements as $index => $element) {
    //echo $element->ownerDocument->saveXML( $element ) . PHP_EOL;
    echo $element->ownerDocument->saveHTML( $element ) . PHP_EOL; //this is working, but i cant use it becase the php version. im using 5.3.3-7 php version
    //http://php.net/manual/en/domdocument.savehtml.php
}

及其工作。但是在服务器上php版本早于5.4,所以我不能像这样使用saveHTML方法。

我该怎么做?

BTW我工作的php版本是5.3.3-7

完整代码在此处:http://sandbox.onlinephpfunctions.com/code/23f5629cbd5a4ae031efc5e3c8ca419043b5a158

1 个答案:

答案 0 :(得分:0)

foreach($elements as $index => $element) {
    $dom = new DOMDocument();
    $dom->appendChild($dom->importNode($element,true));
    echo $dom->saveHTML();
}