kubernetes在什么基础上重新启动计数增加

时间:2018-06-20 07:29:42

标签: kubernetes

我的kubernetes集群运行良好。它有4个工作人员和1个主控人员,可通过仪表板查看状态。运行一段时间后,我查看了一个节点的Restart计数,它是8。我立即运行describe命令来获取任何事件,但是该pod没有任何事件。但是,当我检查容器的日志时,发现该节点本身断电了4次,但是却不知道为什么它没有任何事件。

在另一个节点中,在查看重新启动次数时,我得到的事件为Sandbox changed,这意味着该节点可能已关闭电源一段时间,因此master失去了与它的连接,因此增加了重新启动的次数计数为2。

  1. 我想知道我们如何获取与此重新启动计数相关的日志/调试,以了解为什么重新启动。
  2. 每当重新创建pod时,pod都会使用一个新名称吗?如果是这样,我们如何获得上一个吊舱的事件。
  3. Does sandbox changed event实际上意味着主服务器实际上失去了连接。?

1 个答案:

答案 0 :(得分:2)

逐步:

  1. 我将检查kubelet和docker daemon日志,这些重新启动应该出现在日志中的某处,并希望更多有关导致它们的原因的信息。

  2. 是的,广告连播的名称是唯一的,因此每次删除和重新创建广告连播时都会更改。您可以尝试使用kubectl get po -a查找广告连播。另一种解决方案是使用kubectl get events获取所有事件,然后进行过滤以查找您的广告连播的事件。

  3. 我之前已经看到此错误,对我而言,这意味着docker守护程序网络存在问题。但是我在谷歌搜索了一下,我看到了许多其他原因。同样,尝试分析docker守护程序和kubelet日志以及dmesg。如果您有疑问,请在您的问题日志中添加一个链接,我会尽力提供帮助。