$url = 'http://www.test.com/';
$dom = new DOMDocument;
@$dom->loadHTMLFile($url);
$links = $dom->getElementsByTagName('a');
foreach ($links as $link) {
我目前正在使用上面的脚本在页面上捕获链接,但我发现总是有重复的链接。在页面上,有一个链接的图片,后面是一个文本链接,它链接到同一个链接。是否有一种简单的方法来捕获文本链接,而不是图像链接?
答案 0 :(得分:2)
正如我所说,我可能会采取清理结果集中的欺骗的方法。不确定你在抓什么,但如果链接仅与图像一起使用会怎么样?
你甚至可以计算出现次数。
$url = 'http://www.test.com/';
$dom = new DOMDocument;
@$dom->loadHTMLFile($url);
$links = $dom->getElementsByTagName('a');
$distinctLinks = [];
foreach ($links as $link) {
$distinctLinks[$link] = (int) $distinctLinks[$link] + 1;
}