我有在mod_perl下运行的perl代码,它使用Net :: LDAP模块连接到openldap服务器slapd。
我正在尝试设置这样的连接超时:
my $ldap = Net::LDAP->new($server, timeout => 120);
但是当slapd负载很重时,我会在大约20秒后让连接尝试超时。
Net :: LDAP使用IO :: Socket和IO :: Select实现其连接处理,特别是IO :: Socket中的这段代码(注意我添加了一些额外的调试代码):
sub connect {
@_ == 2 or croak 'usage: $sock->connect(NAME)';
my $sock = shift;
my $addr = shift;
my $timeout = ${*$sock}{'io_socket_timeout'};
my $err;
my $blocking;
my $start = scalar localtime;
$blocking = $sock->blocking(0) if $timeout;
if (!connect($sock, $addr)) {
if (defined $timeout && ($!{EINPROGRESS} || $!{EWOULDBLOCK})) {
require IO::Select;
my $sel = new IO::Select $sock;
undef $!;
if (!$sel->can_write($timeout)) {
$err = $! || (exists &Errno::ETIMEDOUT ? &Errno::ETIMEDOUT : 1);
$@ = "connect: timeout";
}
elsif (!connect($sock,$addr) &&
not ($!{EISCONN} || ($! == 10022 && $^O eq 'MSWin32'))
) {
# Some systems refuse to re-connect() to
# an already open socket and set errno to EISCONN.
# Windows sets errno to WSAEINVAL (10022)
my $now = scalar localtime;
$err = $!;
$@ = "connect: (1) $! : start = [$start], now = [$now], timeout = [$timeout] : " . Dumper(\%!);
}
}
elsif ($blocking || !($!{EINPROGRESS} || $!{EWOULDBLOCK})) {
$err = $!;
$@ = "connect: (2) $!";
}
}
$sock->blocking(1) if $blocking;
$! = $err if $err;
$err ? undef : $sock;
}
我看到这样的日志输出:
connect: (1) Connection timed out : start = [Tue Jun 19 14:57:44 2012], now = [Tue Jun 19 14:58:05 2012], timeout = [120] : $VAR1 = {
'EBADR' => 0,
'ENOMSG' => 0,
<snipped>
'ESOCKTNOSUPPORT' => 0,
'ETIMEDOUT' => 110,
'ENXIO' => 0,
'ETXTBSY' => 0,
'ENODEV' => 0,
'EMLINK' => 0,
'ECHILD' => 0,
'EHOSTUNREACH' => 0,
'EREMCHG' => 0,
'ENOTEMPTY' => 0
};
: Started attempt at Tue Jun 19 14:57:44 2012
20秒连接超时来自哪里?
编辑:我现在找到了罪魁祸首:/ proc / sys / net / ipv4 / tcp_syn_retries,默认情况下设置为5,5次重试大约需要20秒。 http://www.sekuda.com/overriding_the_default_linux_kernel_20_second_tcp_socket_connect_timeout答案 0 :(得分:2)
简短的回答是,一些Linux内核在connect()上施加了20秒的超时。 This is a bug
请注意,链接的sekuda显然不明确:默认值tcp_syn_retries
(5)和重试退避会使超时大于20秒。在上面链接的错误讨论中给出了缺失的细微差别。
尝试升级。
IO :: Socket版本1.34中的connect
子句(例如,在perl 5.16中),select()
用于编写和以查找错误的套接字。然后使用getsockopt()
/ SO_ERROR检查错误的套接字是否存在真正的错误情况。
我怀疑你得到的是TCP 'soft error'(例如,ICMP主机现在无法访问)。但是,您的IO :: Socket版本错过了要点,因为它从未查看过SO_ERROR。
如果升级无法解决问题,那么正确的解决方法是在IO :: Socket :: connect to do what the Linux connect(2) man page suggests内修改逻辑,即在非阻塞后检查SO_ERROR connect()
套接字select()
s 可写。
在此期间,有点像......
# untested!
use Errno;
...
my $relative_to = 120;
my $absolute_to = time() + $relative_to;
TRYCONN: {
$ldap = Net::LDAP->new($server, timeout => $relative_to);
if (! $ldap and $!{ETIMEDOUT}) {
$rel_to = $absolute_to - time();
redo TRYCONN if $relative_to > 0;
}
}
die "Aaaaargh" unless $ldap;
...或类似的应该做的伎俩。