我的ICP节点似乎正在运行,但该节点上的服务没有响应,有时会返回504网关超时。
当我通过SSH连接到无响应的节点并运行journalctl -u kubelet -f
时,我看到错误消息,例如transport: dial unix /var/run/docker/containerd/docker-containerd.sock: connect: connection refused
此外,当我运行top
时,我看到dockerd
使用了通常较高的CPU百分比。
导致此行为的原因是什么?如何将节点恢复到正常工作状态?
答案 0 :(得分:1)
这些错误可能是由于Docker的一个已知问题,即使重新启动containerd
守护程序,也会使用旧的containerd
引用。此缺陷导致Docker守护程序进入内部错误循环,该循环使用大量CPU资源并记录大量错误。有关此错误的详细信息,请参阅针对Moby项目的Refresh containerd remotes on containerd restarted拉取请求。
要解决此问题,请使用host operating system命令重新启动节点上的docker服务。一段时间后,服务应该恢复。