如何使用xpath获取网站内容?

时间:2013-08-07 19:55:32

标签: xpath

我想检查网站是否使用schema.org标签。但是使用我的脚本我得到一个空洞的结果。

$sUrl = 'http://adresse.gelbeseiten.de/120002540061/alois-dallmayr-kg/muenchen/altstadt#gaststaetten-und-restaurants;originIndex=1;origin=/restaurant/muenchen';

$dom = new DOMDocument();
@$dom->loadHtmlFile($sUrl);

$xpath = new DomXPath($dom);

$aLinks = array();
$vRes = $xpath->query('//text()[contains(.,"itemprop="streetAdress")]');
foreach ($vRes as $obj) {
    $aLinks[] = $obj->textContent;
}
print_r($aLinks);

1 个答案:

答案 0 :(得分:0)

不确定你想要准确得到什么。

如果您要使用<span id="inserat_addr_str" itemprop="street-address"> Dienerstr. 14-15</span>属性获取itemprop,请尝试使用以下xpath(ID和文本也会为您提供元素,但我假设您要使用itemprop

$vRes = $xpath->query("//*[@itemprop='street-address']");
// $vRes = $xpath->query("//*[@id='inserat_addr_str']");
// $vRes = $xpath->query("//*[contains(text(), 'Dienerstr. 14-15')]");