有效地处理lwp超时

时间:2012-06-12 02:13:39

标签: perl timeout lwp lwp-useragent

我正在使用LWP从网页下载内容,我想限制等待页面的时间。这是在lwp中完成的,如下所示:

my $ua = LWP::UserAgent->new;
$ua->timeout(10);
$ua->get($url);

这样可以正常工作,除非超时达到极限,它就会死掉,我无法继续使用脚本!我真的很想妥善处理这个超时,这样我就可以记录url超时然后转到下一个。有谁知道如何做到这一点?谢谢!

3 个答案:

答案 0 :(得分:15)

LWP::Agentget()会返回一个HTTP::Response对象,可用于检查错误:

use LWP::Agent;
use HTTP::Status ();

my $ua = LWP::UserAgent->new;
$ua->timeout(10);
my $response = $ua->get($url);

if ($response->is_error) {
    printf "[%d] %s\n", $response->code, $response->message;

    # record the timeout
    if ($response->code == HTTP::Status::HTTP_REQUEST_TIMEOUT) {
        ...
    }
}

顺便说一句,现在更好的做法是使用Try::Tiny代替eval {...}。它会为您try {...} catch {...}。它解决了检查if $@的一些问题(参见Try::Tiny文档中的背景部分)。

答案 1 :(得分:1)

您可以使用eval块在Perl中执行相当于try {} catch {}的操作:

http://perldoc.perl.org/functions/eval.html

答案 2 :(得分:1)

对于大多数用途,LWP :: UserAgent的超时已足够,但它确实存在一些缺点......它适用于每个系统调用,而不是它们的聚合。如果你真的需要一个固定的超时时间,这是LWPx::ParanoidAgent需要注意的事情之一。