我有一个用Java编写的TCP服务器和客户端,并使用jdk1.6在Rhel 5.3上的不同机器上运行。我已经处理了几乎所有可以检测到“服务器”断开连接的方法。
以下是服务器代码的片段
private void listenforConnection() {
try {
socket = serverSocket.accept();
socket.setTcpNoDelay(true);
socket.setKeepAlive(true);
socket.setSoTimeout(5);
bosTcpOutStream = new BufferedOutputStream(socket.getOutputStream());
bisTcpInStream = new BufferedInputStream(socket.getInputStream());
log("New connection accepted from " + socket.getRemoteSocketAddress().toString());
sendHeartBeatsToClient();
} catch (IOException ie) {
log("Listener IOException : " + ie.getMessage());
}
}
private void sendHeartBeatsToClient() {
try {
while (true) {
long lngCurrentMillis=System.currentTimeMillis() ;
if ((lngCurrentMillis - lngLastSentMessageTime) >= 5000) {
byte[] bHeartBeat = getHeartBeatMessage();
bosTcpOutStream.write(bHeartBeat);
bosTcpOutStream.flush();
lngLastSentMessageTime = System.currentTimeMillis();
log("Heartbeat sent.");
} else {
try {
if (bisTcpInStream.read() == -1) {
log("Read Input Stream returned -1");
break;
}
} catch (SocketTimeoutException se) {
//Do nothing as i am not expecting the client to send anything.
} catch (IOException e) {
log("Read Input Stream error - " + e.getMessage());
break;
}
}
Thread.sleep(1);
}
} catch (IOException e) {
disconnectClientAndCloseSocket();
log("IO Exception" +e.getMessage());
} catch (InterruptedException e) {
disconnectClientAndCloseSocket();
log("Thread interrupted terminating." + e.getMessage());
}
}
我还修改了“Server”机器上的tcp-keepalive内核参数,如下所示:
net.ipv4.tcp_keepalive_time=2
net.ipv4.tcp_keepalive_probes=1
net.ipv4.tcp_keepalive_intvl=2
现在,当我通过拔出客户端计算机的网络电缆来模拟断开连接时(在建立连接并从服务器接收到初始数据之后),我看到两种不同的结果,我无法理解: -
如果在成功连接客户端10到15秒后拔下电缆线。在“服务器”上,在 10分钟拔出电缆后,我收到“无路由到主机”的IO异常。
如果在成功连接客户端60秒后拔下电缆线。在“服务器”上引发IO异常,“连接超时”在10秒内。这是有效的行为,记住保持活动设置。
我已经尝试了几次,我总能得到相同的结果。
我不明白为什么第一个结果需要10分钟,而且不像第二个结果那样。我错过了什么吗?