我有一个由有状态集创建的Kubernetes Pod(不确定是否重要)。此吊舱中有两个容器。当两个容器中的一个出现故障并使用df2
命令时,1/2容器就绪,状态为“#34;错误。”#34;第二个容器从不尝试重启,除了使用get pods
标志外,我无法销毁pod。典型的删除使得pod悬挂在"终止"无论是永远还是非常长的时间。可能导致此行为的原因以及如何进行调试?
答案 0 :(得分:1)
我在k8s 1.6群集esp中的节点上遇到类似的问题。当节点运行了几个星期。它可能发生在任何节点上。发生这种情况时,我会在节点上重新启动kubelet,错误就会消失。
这不是最好的事情,但它总能解决问题。如果您重新启动kubelet,它也不会对集群造成损害,因为正在运行的pod继续保持运行状态。
kubectl get po -o wide
可能会向您显示错误的pod正在一个节点上运行。 SSH到该节点并重新启动kubelet。