我们在3台机器的集群中使用非群模式,在容器之间设置了一堆链接,并注意到一个非常奇怪的问题:2台特定机器之间的容器无法通信:机器A上的容器可以与机器B通信,但无法到达机器C的容器。但是,容器机器B和机器C完全能够相互连接。
阅读完日志后,我们注意到机器A /机器C上的编织容器(连接有问题的容器)无法到达对面的机器。
日志中包含以下消息:
INFO: 2017/04/11 08:33:35.169670 ->[XXX.XXX.XXX.XXX:6783] attempting connection
INFO: 2017/04/11 08:33:35.187072 ->[XXX.XXX.XXX.XXX:6783] connection shutting down due to error during handshake: Unable to decrypt TCP msg
INFO: 2017/04/11 08:42:39.024325 ->[XXX.XXX.XXX.XXX:49040] connection accepted
INFO: 2017/04/11 08:42:39.035681 ->[XXX.XXX.XXX.XXX:49040] connection shutting down due to error during handshake: Unable to decrypt TCP msg
更奇怪的是,没有设置防火墙规则,机器完全可以访问,我甚至可以telnet到另一个编织守护进程(使用端口6783)并获得“weave”字符串作为响应。我们尝试重新启动,重新部署群集并甚至回收机器而没有运气:一些错误或问题阻止了这些特定机器上的编织进行通信。
如果您愿意以任何方式提供帮助或暗示,我们将非常感谢您,SO用户。
软件版本,以防万一。
编辑:编织状态X输出(编辑):
编织状态连接:
将established encrypted
的连接列为我可以访问容器的主机,并为有问题的主机failed Unable to decrypt TCP msg, retry: 2017-04-11 13:18:07.695016283 +0000 UTC
说明
编织状态对等体: 仅列出可访问的主机
编织状态报告: 只是具有相同数据的JSON版本