HTML DOM通过Parent to Child关系提取内容

时间:2012-07-06 08:44:14

标签: php html dom

我想使用PHP解析HTML DOM;

我有一个字符串PN,我想检测已找到PN作为内容的DOM元素的Parrent;

然后,在发现Parrent元素的情况下,我需要所有这些元素的孩子们;

必须忽略不在Parrent结构下的所有其他DOM元素;

1 个答案:

答案 0 :(得分:1)

这是我设法写的,但我不知道在$ node->之后要写什么为了获得元素(h1,h2,div,span)......

//start xpath
// Create new DOM object:
$dom = new DomDocument();
// Load HTML code:
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$nodes = $xpath->query('//*');
$data = array();
foreach ($nodes as $node) {
    $data[] = $node->textContent;
}
if( count( $data ) > 0 )
{
echo '<br/>xpath<br/>';
print_r( $data );
}
//stop xpath