捕获没有图像链接的PHP链接

时间:2015-07-01 21:35:17

标签: php dom

$url = 'http://www.test.com/';
$dom = new DOMDocument;
@$dom->loadHTMLFile($url);

$links = $dom->getElementsByTagName('a');
foreach ($links as $link) {

我目前正在使用上面的脚本在页面上捕获链接,但我发现总是有重复的链接。在页面上,有一个链接的图片,后面是一个文本链接,它链接到同一个链接。是否有一种简单的方法来捕获文本链接,而不是图像链接?

1 个答案:

答案 0 :(得分:2)

正如我所说,我可能会采取清理结果集中的欺骗的方法。不确定你在抓什么,但如果链接与图像一起使用会怎么样?

你甚至可以计算出现次数。

$url = 'http://www.test.com/';
$dom = new DOMDocument;
@$dom->loadHTMLFile($url);

$links = $dom->getElementsByTagName('a');
$distinctLinks = [];
foreach ($links as $link) {
    $distinctLinks[$link] = (int) $distinctLinks[$link] + 1;
}