PHP DOMXPath查询使用元素的innerHTML / nodeValue来查找并返回元素

时间:2011-09-08 03:26:36

标签: php dom xpath domdocument domxpath

如果要检查元素的innerHTML / nodeValue,可以帮助我使用正确的语法吗?

我对名称没有问题,但是Age在一个普通的div元素中,使用什么语法来代替“不确定要在这里放什么”。

$ html是来自互联网的页面

人名如下:

<span class="fullname">John Smith</span>

人口年龄如下:

<div>Age: 28</div>

我有以下PHP:

<?php
$dom = new DomDocument();
@$dom->loadHTML($html);
$finder = new DOMXPath($dom);

//Full Name
$findName = "fullname";
$queryName = $finder->query("//span[contains(@class, '$findName')]");
$name = $queryName->item(0)->nodeValue;

//Age
$findAge = "Age: ";
$queryAge = $finder->query("//div[NOT SURE WHAT TO PUT HERE]");
$age = substr($queryAge->item(0)->nodeValue, 5);
?>

1 个答案:

答案 0 :(得分:2)

尝试

$queryAge = $finder->query("//div[starts-with(., '$findAge')]");

由于空白,starts-with()取得了有限的成功,所以你可能不得不求助于

$queryAge = $finder->query("//div[contains(., '$findAge')]");

如果有可能发现误报(即其中包含“年龄:”的其他div),您可以通过使用更具体的路径(如果已知)来避免这种情况,即

$queryAge = $finder->query("//div[@id='something']//div[contains(., '$findAge')]");