无法获取元素的nodeValue

时间:2019-02-13 04:06:52

标签: php dom xpath domxpath

我正在开发一个简单的seo应用程序,该应用程序通过curl_multi_getcontent从其他网站获得排名结果。

我的问题是我无法使用xpath定位元素的位置。

<div class="mt10">
    <ul class="ResultListWrap">
        <li class="ReListCent RelistHead clearfix"></li>
        <li class="ReListCent RelistHead bor-b1s clearfix">
            <div class="w25-0"></div>
            <div class="w8-0"></div>
            <div class="w8-0"></div>
            <div class="w8-0"></div>
            <div class="w8-0">
                <a href="">Text</a> <!-- GET THE VALUE OF THIS -->
            </div>
            <div class="w8-0"></div>
            <div class="w25-0"></div>
        </li>
        <li class="ReListCent RelistHead bor-b1s clearfix"></li>
        <li class="ReListCent RelistHead bor-b1s clearfix"></li>
        <li class="ReListCent RelistHead bor-b1s clearfix"></li>
        <li class="ReListCent RelistHead bor-b1s clearfix"></li>
        <li class="ReListCent RelistHead bor-b1s clearfix"></li>
        <li class="ReListCent RelistHead bor-b1s clearfix"></li>
        <li class="ReListCent RelistHead bor-b1s clearfix"></li>
        <li class="ReListCent RelistHead bor-b1s clearfix"></li>
        <li class="ReListCent RelistHead bor-b1s clearfix"></li>
    </ul>
</div>

我只需要从第二div的第五<li>中获得结果。

示例代码

        $urlContent = curl_multi_getcontent($url);

        $document = new \DOMDocument('1.0', 'UTF-8');

        // set error level
        $internalErrors = libxml_use_internal_errors(true);
        // load HTML
        $document->loadHTML($urlContent);
        // Restore error level
        libxml_use_internal_errors($internalErrors);

        $finder = new DomXPath($document);
        $results = $finder->query('(//div[@class="ReListCent"])[2]/div[5]/a') -> nodeValue;

        if(isset($results)){

          echo $results;

        }else{
          // NO RESULT
        }

1 个答案:

答案 0 :(得分:1)

您的XPath不正确。元素是<li>,而不是<div>,并且由于class的{​​{1}}包含其他值,因此无法直接比较。尝试以下方法:

<li>

此外,DOMXPath::query返回一个DOMNodeList,因此,要访问单个元素,您需要使用((//li[contains(@class,"ReListCent")])[2]/div)[5]/a 表示法或[n]在列表中指定一个索引。所以你应该使用:

->item(n)

我做了一个小型演示,展示了3v4l.org上工作的代码的基础。