我有以下(PHP)代码遍历整个DOM文档以获取所有文本节点。这是一个丑陋的解决方案,我相信一定有更好的方法......所以,有吗?
$skip = false;
$node = $document;
$nodes = array();
while ($node) {
if ($node->nodeType == 3) {
$nodes[] = $node;
}
if (!$skip && $node->firstChild) {
$node = $node->firstChild;
} elseif ($node->nextSibling) {
$node = $node->nextSibling;
$skip = false;
} else {
$node = $node->parentNode;
$skip = true;
}
}
感谢。
答案 0 :(得分:12)
您需要的XPath表达式是//text()
。尝试将其与DOMXPath::query
一起使用。例如:
$xpath = new DOMXPath($doc);
$textnodes = $xpath->query('//text()');