DOM:获取文档中的所有文本节点(PHP)

时间:2009-04-20 15:18:06

标签: php dom text traversal

我有以下(PHP)代码遍历整个DOM文档以获取所有文本节点。这是一个丑陋的解决方案,我相信一定有更好的方法......所以,有吗?

$skip = false;
$node = $document;
$nodes = array();
while ($node) {
    if ($node->nodeType == 3) {
        $nodes[] = $node;
    }
    if (!$skip && $node->firstChild) {
        $node = $node->firstChild;
    } elseif ($node->nextSibling) {
        $node = $node->nextSibling;
        $skip = false;
    } else {
        $node = $node->parentNode;
        $skip = true;
    }
}

感谢。

1 个答案:

答案 0 :(得分:12)

您需要的XPath表达式是//text()。尝试将其与DOMXPath::query一起使用。例如:

$xpath = new DOMXPath($doc);
$textnodes = $xpath->query('//text()');