我需要抓取一个网站并检索每隔几分钟不断更新的某些数据。我该怎么做?
答案 0 :(得分:4)
答案 1 :(得分:-2)
使用sleep
控制等待时间,并使用WWW::Mechanize
进行数据检索:
use strict;
use WWW::Mechanize;
my $mech = WWW::Mechanize->new();
my $url = "http://www.nytimes.com"; # a sample webpage
while (1) {
$mech->get($url);
print $mech->content(format => 'text'); # read docs for WWW::Mechanize for advanced content processing
sleep 300; # wait for 5 minutes
}
编辑:改进了样本内容检索过程。