寻找一种从页面中抓取URL并将其输出到文本文件的方法

时间:2010-10-22 00:30:49

标签: perl vbscript

我正在寻找一种从网页中抓取URL并将其输出到文本文件的方法。 例如,如果页面包含多个http://example.com/article,我想抓住这两个URL并将其输出到文本文件。

2 个答案:

答案 0 :(得分:5)

查看WWW::Mechanize

示例代码:

use strict;
use warnings;
use 5.010;

use WWW::Mechanize;

my $mech = WWW::Mechanize->new();
$mech->get('http://example.com/example');
foreach my $link ($mech->find_all_links()) {
    say $link->url_abs();
}

答案 1 :(得分:3)

使用HTML::SimpleLinkExtor

use strict;
use warnings;

use HTML::SimpleLinkExtor;

my $extor = HTML::SimpleLinkExtor->new();
$extor->parse_url('http://example.com/article');
my @links = $extor->absolute_links();