IBM Cloud Private节点似乎正在运行,但服务没有响应

时间:2018-02-21 14:34:25

标签: docker ibm-cloud-private

我的ICP节点似乎正在运行,但该节点上的服务没有响应,有时会返回504网关超时。

当我通过SSH连接到无响应的节点并运行journalctl -u kubelet -f时,我看到错误消息,例如transport: dial unix /var/run/docker/containerd/docker-containerd.sock: connect: connection refused

此外,当我运行top时,我看到dockerd使用了通常较高的CPU百分比。

导致此行为的原因是什么?如何将节点恢复到正常工作状态?

1 个答案:

答案 0 :(得分:1)

这些错误可能是由于Docker的一个已知问题,即使重新启动containerd守护程序,也会使用旧的containerd引用。此缺陷导致Docker守护程序进入内部错误循环,该循环使用大量CPU资源并记录大量错误。有关此错误的详细信息,请参阅针对Moby项目的Refresh containerd remotes on containerd restarted拉取请求。

要解决此问题,请使用host operating system命令重新启动节点上的docker服务。一段时间后,服务应该恢复。