通常,我用Xpath得到了想要的东西,但是这次我无法获取想要的URL。在这个page中,这个div
标签“ btn-cont col-md-8 typesquare_tags”中有几个网址,因此我试图仅获取一个href:href="https://www.31sumai.com/mfr/K1503/outline.html"
所以我正在使用此代码块,但无法到达。
foreach($links as $href){
$getContent = pageContent($href);
$getXpath = new \DOMXPath($getContent);
$Route = $getXpath->query("//div[@class='btn-cont col-md-8 typesquare_tags']/a[3]");
foreach ($Route as $link3){
$linkBOX[] = trim($link3->getAttribute('href'));
}
}
我在这里错过了什么吗?
PS。 pageContent是包含DOMDoc / LoadHTML
的功能答案 0 :(得分:1)
"typesquare_tags"
类名动态添加。尝试通过前两个类名称找到div
:
"//div[@class='btn-cont col-md-8']/a[3]"
或
"//div[contains(@class, 'btn-cont') and contains(@class, 'col-md-8')]/a[3]"