Question

$url = 'http://www.test.com/';
$dom = new DOMDocument;
@$dom->loadHTMLFile($url);

$links = $dom->getElementsByTagName('a');
foreach ($links as $link) {

我目前正在使用上面的脚本在页面上捕获链接，但我发现总是有重复的链接。在页面上，有一个链接的图片，后面是一个文本链接，它链接到同一个链接。是否有一种简单的方法来捕获文本链接，而不是图像链接？

Answer 1

正如我所说，我可能会采取清理结果集中的欺骗的方法。不确定你在抓什么，但如果链接仅与图像一起使用会怎么样？

你甚至可以计算出现次数。

$url = 'http://www.test.com/';
$dom = new DOMDocument;
@$dom->loadHTMLFile($url);

$links = $dom->getElementsByTagName('a');
$distinctLinks = [];
foreach ($links as $link) {
    $distinctLinks[$link] = (int) $distinctLinks[$link] + 1;
}

捕获没有图像链接的PHP链接

1 个答案: