我正在开发一个简单的seo应用程序,该应用程序通过curl_multi_getcontent
从其他网站获得排名结果。
我的问题是我无法使用xpath定位元素的位置。
<div class="mt10">
<ul class="ResultListWrap">
<li class="ReListCent RelistHead clearfix"></li>
<li class="ReListCent RelistHead bor-b1s clearfix">
<div class="w25-0"></div>
<div class="w8-0"></div>
<div class="w8-0"></div>
<div class="w8-0"></div>
<div class="w8-0">
<a href="">Text</a> <!-- GET THE VALUE OF THIS -->
</div>
<div class="w8-0"></div>
<div class="w25-0"></div>
</li>
<li class="ReListCent RelistHead bor-b1s clearfix"></li>
<li class="ReListCent RelistHead bor-b1s clearfix"></li>
<li class="ReListCent RelistHead bor-b1s clearfix"></li>
<li class="ReListCent RelistHead bor-b1s clearfix"></li>
<li class="ReListCent RelistHead bor-b1s clearfix"></li>
<li class="ReListCent RelistHead bor-b1s clearfix"></li>
<li class="ReListCent RelistHead bor-b1s clearfix"></li>
<li class="ReListCent RelistHead bor-b1s clearfix"></li>
<li class="ReListCent RelistHead bor-b1s clearfix"></li>
</ul>
</div>
我只需要从第二div
的第五<li>
中获得结果。
示例代码
$urlContent = curl_multi_getcontent($url);
$document = new \DOMDocument('1.0', 'UTF-8');
// set error level
$internalErrors = libxml_use_internal_errors(true);
// load HTML
$document->loadHTML($urlContent);
// Restore error level
libxml_use_internal_errors($internalErrors);
$finder = new DomXPath($document);
$results = $finder->query('(//div[@class="ReListCent"])[2]/div[5]/a') -> nodeValue;
if(isset($results)){
echo $results;
}else{
// NO RESULT
}
答案 0 :(得分:1)
您的XPath不正确。元素是<li>
,而不是<div>
,并且由于class
的{{1}}包含其他值,因此无法直接比较。尝试以下方法:
<li>
此外,DOMXPath::query
返回一个DOMNodeList
,因此,要访问单个元素,您需要使用((//li[contains(@class,"ReListCent")])[2]/div)[5]/a
表示法或[n]
在列表中指定一个索引。所以你应该使用:
->item(n)
我做了一个小型演示,展示了3v4l.org上工作的代码的基础。