最终编辑/结论
这是一个与netty无关的问题,仍然很难调试。有时会阻止messageReceived中的工作线程,所以一段时间后池中没有可用的线程。
原始问题
在我的公司,我们正在使用netty来监听GPS跟踪设备的连接。跟踪器通过GPRS进行通信。
我们经历过netty 3.2.4-final的非常奇怪的行为。
过了一段时间(我无法确切知道多少,但接近一天)我们没有得到跟踪器的任何消息。这意味着我们不会调用我们实现的SimpleCahnnelUpstreamHandler的messageReceived方法!但是,如果我使用tcpdump捕获所有数据包,我可以看到所有消息进入!
这是一个已知问题,已在更高版本的netty中修复了吗?
我们的渠道渠道如下:
...
final TcpListenerChannelHandler tcpChannelHandler;
@Inject
public TcpListenerPipeline(TcpListenerChannelHandler tcpChannelHandler) {
this.tcpChannelHandler = tcpChannelHandler;
}
@Override
public ChannelPipeline getPipeline() throws Exception {
ChannelPipeline p = Channels.pipeline();
p.addLast("frameDecoder", new DelimiterBasedFrameDecoder(2048, Delimiters.lineDelimiter()));
p.addLast("encoder", new ByteArrayWrapperEncoder());
p.addLast("handler", tcpChannelHandler);
return p;
}
...
我们以下列方式实例化听取:
public void startListen() {
ChannelFactory channelFactory = new NioServerSocketChannelFactory(Executors.newCachedThreadPool(), Executors.newCachedThreadPool(),20);
bootstrap = new ServerBootstrap(channelFactory);
bootstrap.setPipelineFactory(pipeline);
bootstrap.setOption("child.tcpNoDelay", true);
bootstrap.setOption("child.keepAlive", true);
lazyLogger.getLogger().info("Binding Tcp listener to 0.0.0.0 on port '{}'", listenPort);
serverChannel = bootstrap.bind(new InetSocketAddress("0.0.0.0", listenPort));
}
有没有人知道哪些是错的?或者,我们是否应该每隔一小时左右手动断开所有频道?
修改 的
我有更多关于此问题的信息
如果没有处理任何消息,也会发生在成功远程连接时未调用channelConnected。我远程调试了这个问题,发现:
最奇怪的是,有时netty会注意到某个频道已连接,有时却没有。
EDIT2:
TcpListenerCahnnelHandler是SimpleChannelUpstreamHandler的简单实现
它的亮点:
public class TcpListenerChannelHandler extends SimpleChannelUpstreamHandler {
...
@Override
public void channelConnected(ChannelHandlerContext ctx, ChannelStateEvent e) throws Exception {
super.channelConnected(ctx, e);
_logger.info("{} device connected from: {}", deviceProtocol.getName(), ctx.getChannel().getRemoteAddress());
deviceConnectionRegistry.channelConnected(ctx.getChannel());
}
@Override
public void channelDisconnected(ChannelHandlerContext ctx, ChannelStateEvent e) throws Exception {
super.channelDisconnected(ctx, e);
_logger.info("{} device from endpoint '{}' disconnected.", deviceProtocol.getName(), ctx.getChannel().getRemoteAddress());
deviceConnectionRegistry.channelDisconnected(ctx.getChannel());
}
@Override
public void messageReceived(ChannelHandlerContext ctx, MessageEvent messageEvent) throws Exception {
super.messageReceived(ctx, messageEvent);
...
NOTE: here we process the meassage, I do not think it can cause any problem
}
@Override
public void exceptionCaught(ChannelHandlerContext ctx, ExceptionEvent e) throws Exception {
if(_logger.isWarnEnabled())
_logger.warn(deviceProtocol.getName()+ " device"
+e.getChannel().getRemoteAddress()+" channel", e.getCause());
if (!(e.getCause() instanceof ConnectException))
e.getChannel().close();
}
同时我升级到3.3.1决赛。如果问题再次出现,我知道在哪里继续调试。
编辑3:
我已经升级到3.3.1决赛,两天之后又出现了同样的问题。
我不知道它是否相关,但我们在同一物理接口上有更多IP地址。我们应该只尝试一个界面吗?是否存在更多eth接口的已知问题?
但是再次:tcpdump识别跟踪器的消息,但netty不会在我的自定义处理程序中调用messageReceived。
编辑4:
我进一步调试了代码。问题发生在NioWorker.java 在第131行(布尔提供= registerTaskQueue.offer(registerTask);)运行正常,但随后将永远不会处理该任务。这意味着第748行的RegisterTask.run()永远不会被调用。
答案 0 :(得分:1)
不知道,您是否尝试添加LoggingHandler来观看所有内容? 我用来使用自定义处理程序:
/**
*
* Adapted from the original LoggingHandler in Netty.
*/
public class LoggingHandler implements ChannelUpstreamHandler, ChannelDownstreamHandler {
String name;
boolean hexDump;
public LoggingHandler(String name, boolean hexDump) {
this.name = name;
this.hexDump = hexDump;
}
/**
* Logs the specified event to the {@link InternalLogger} returned by
* {@link #getLogger()}. If hex dump has been enabled for this handler,
* the hex dump of the {@link ChannelBuffer} in a {@link MessageEvent} will
* be logged together.
*/
public void log(ChannelEvent e) {
String msg = name + " >> " + e.toString();
// Append hex dump if necessary.
if (hexDump && e instanceof MessageEvent) {
MessageEvent me = (MessageEvent) e;
if (me.getMessage() instanceof ChannelBuffer) {
ChannelBuffer buf = (ChannelBuffer) me.getMessage();
msg = msg + " - (HEXDUMP: " + ChannelBuffers.hexDump(buf) + ')';
}
}
// Log the message (and exception if available.)
if (e instanceof ExceptionEvent) {
Logger.debug(this, msg, ((ExceptionEvent) e).getCause());
} else {
Logger.debug(this, msg);
}
}
public void handleUpstream(ChannelHandlerContext ctx, ChannelEvent e)
throws Exception {
log(e);
ctx.sendUpstream(e);
}
public void handleDownstream(ChannelHandlerContext ctx, ChannelEvent e)
throws Exception {
log(e);
ctx.sendDownstream(e);
}
在客户端和服务器端插入。 在服务器端,我用它将它添加到子和父:
ChannelFactory factory = new NioServerSocketChannelFactory(Executors.newCachedThreadPool(),
Executors.newCachedThreadPool());
ServerBootstrap bootstrap = new ServerBootstrap(factory);
bootstrap.setOption("child.tcpNoDelay", true);
bootstrap.setOption("child.keepAlive", true);
bootstrap.setPipelineFactory(new ChannelPipelineFactory() {
public ChannelPipeline getPipeline() throws Exception {
ChannelPipeline pipeline = Channels.pipeline();
pipeline.addLast("LOGGER", new LoggingHandler("SERVER", true));
pipeline.addLast("LAUNCHER", handler.new OnChannelConnectedPlugger());
return pipeline;
}
});
bootstrap.setParentHandler(new LoggingHandler("SERVER-PARENT", true));