我在迭代DOMNodeList中的元素时遇到问题。我试图将整个段落放入一个字符串。我可以用这个分别得到每个句子:
$node = $paragraph->item(0); //first line of the paragraph
$node = $paragraph->item(1); //second line of the paragraph
但我似乎无法遍历所有句子并将它们放入一个字符串中。我试过这个,但它没有工作:
for($i=0; $i<3; $i++)
{
$node = $paragraph->item($i);
}
我有什么想法可以做到这一点?
答案 0 :(得分:17)
DOMNodeList实现Traversable,只需使用foreach()
foreach($nodeList as $node) {
//...
}
当然也是可以的。
$length = $nodeList->length;
for ($i = 0; $i < $length; $i++) {
$node = $nodeList->item($i);
//...
}
要获取节点内的所有文本内容,可以使用$ nodeValue或$ textContent属性:
$text = '';
foreach($nodeList as $node) {
$text .= $node->textContent;
}
但这是针对节点列表的。你说这是段落的文字内容。如果你将段落作为DOMElement对象,它也有$ nodeValue和$ textContent属性。
$text = $paragraphNode->textContent;
如果您通过Xpath获取节点,DOMXpath :: evaluate()可以将文本内容作为字符串返回。
$xpath = new DOMXpath($dom);
$text = $xpath->evaluate('string(//p[1])');
答案 1 :(得分:0)
我发现使用foreach()
甚至遍历一个较大的DOMNodeList都会 非常慢 。一种更快的方法是像这样在do-while
循环中使用DOMNode $nextSibling
属性:
$el = $paragraph->firstChild;
do {
// do stuff
} while ($el = $el->nextSibling);
在php.net here的评论中也提到了这一点。