我正在使用LWP从网页下载内容,我想限制等待页面的时间。这是在lwp中完成的,如下所示:
my $ua = LWP::UserAgent->new;
$ua->timeout(10);
$ua->get($url);
这样可以正常工作,除非超时达到极限,它就会死掉,我无法继续使用脚本!我真的很想妥善处理这个超时,这样我就可以记录url超时然后转到下一个。有谁知道如何做到这一点?谢谢!
答案 0 :(得分:15)
LWP::Agent的get()
会返回一个HTTP::Response对象,可用于检查错误:
use LWP::Agent;
use HTTP::Status ();
my $ua = LWP::UserAgent->new;
$ua->timeout(10);
my $response = $ua->get($url);
if ($response->is_error) {
printf "[%d] %s\n", $response->code, $response->message;
# record the timeout
if ($response->code == HTTP::Status::HTTP_REQUEST_TIMEOUT) {
...
}
}
顺便说一句,现在更好的做法是使用Try::Tiny代替eval {...}
。它会为您try {...} catch {...}
。它解决了检查if $@
的一些问题(参见Try::Tiny
文档中的背景部分)。
答案 1 :(得分:1)
您可以使用eval块在Perl中执行相当于try {} catch {}的操作:
答案 2 :(得分:1)
对于大多数用途,LWP :: UserAgent的超时已足够,但它确实存在一些缺点......它适用于每个系统调用,而不是它们的聚合。如果你真的需要一个固定的超时时间,这是LWPx::ParanoidAgent需要注意的事情之一。