Xpath抓取URL

时间:2018-12-17 06:12:14

标签: php xpath

通常,我用Xpath得到了想要的东西,但是这次我无法获取想要的URL。在这个page中,这个div标签“ btn-cont col-md-8 typesquare_tags”中有几个网址,因此我试图仅获取一个href:href="https://www.31sumai.com/mfr/K1503/outline.html"

所以我正在使用此代码块,但无法到达。

foreach($links as $href){
        $getContent = pageContent($href);
        $getXpath = new \DOMXPath($getContent);
        $Route = $getXpath->query("//div[@class='btn-cont col-md-8 typesquare_tags']/a[3]");
        foreach ($Route as $link3){
            $linkBOX[] = trim($link3->getAttribute('href'));
        }
    }

我在这里错过了什么吗?

PS。 pageContent是包含DOMDoc / LoadHTML

的功能

1 个答案:

答案 0 :(得分:1)

"typesquare_tags"类名动态添加。尝试通过前两个类名称找到div

"//div[@class='btn-cont col-md-8']/a[3]"

"//div[contains(@class, 'btn-cont') and  contains(@class, 'col-md-8')]/a[3]"