由于非法UTF-8序列,Javax Websocket关闭

时间:2015-08-25 20:31:37

标签: java utf-8 websocket glassfish tyrus

我用Java编写Websocket客户端,使用javax.websocket API和org.glassfish.tyrus作为实现。

一切通常都有效,但有时候,当我收到非常大的字符串时,连接会以一个神秘的“非法UTF-8序列”结束。作为接近的理由。

log.info("Ws closed cuz: " 
   + reason.getCloseCode() + " , " 
   + reason.getReasonPhrase() + " , " 
   + reason.toString());

输出:

INFO: Ws closed cuz: NOT_CONSISTENT , Illegal UTF-8 Sequence ,
CloseReason[1007,Illegal UTF-8 Sequence]

我猜测字符串太大,或者字符串包含任何不符合UTF-8的字符。

有没有办法获得有关导致此问题的实际字符串/数据包/帧的更多信息?或者,如果有方法告诉tyrus忽略任何编码问题,只需将原始字符串传递给我并让我处理它?<​​/ p>

如果没有,是否有另一个java websockets客户端,它通过套接字传输字符串并且没有进行任何验证,只是让我处理响应?

感谢任何反馈。

2 个答案:

答案 0 :(得分:1)

以下只是猜测。

(1)在服务器端,大字符串被分成一个文本框和一个或多个后续连续帧。从技术上讲,原始的大字符串被转换为字节数组,然后字节数组被分成多个子字节数组。子数组逐个设置为帧(=每帧包含一个子字节数组)。

(2)虽然不能保证每个子字节数组都是有效的UTF-8序列,但是在服务器端或客户端执行有效性检查。如果是这样,那就是Tyrus的错误。

WebSocketListenernv-websocket-client onFrame,onTextFrameonContinuationFrame和其他(注意onTextMessageonTextFrame不同),因此您可以检查每个帧的字节数组。

WebSocket websocket = new WebSocketFactory()
    .createSocket("ws://...")
    .addListener(new WebSocketAdapter() {
        @Override
        public void onFrame(WebSocket ws, WebSocketFrame frame) {
            // If the frame is a text frame with FIN bit cleared, or
            // if the frame is a continuation frame.
            if ((frame.isTextFrame() && frame.getFin() == false) ||
                frame.isContinuationFrame()) {
                // The payload of the frame. There is no guarantee
                // that this byte array is a valid UTF-8 sequence.
                byte[] payload = frame.getPayload();

                // Check whether the payload is a valid UTF-8 sequence
                // if you want to.
                checkPayload(payload);
            }
        }
    })
    .connect();

为什么不使用nv-websocket-client来检查WebSocket连接中发生的情况?

答案 1 :(得分:0)

我刚刚遇到了同样的错误。在我从 org.glassfish.tyrus 版本 1.1 更改为 2.0.0 后,它运行没有任何问题。