Kubernetes豆荚停止了终止 - 如何确定“需要杀死豆荚”背后的原因?

时间:2018-01-16 17:26:30

标签: kubernetes

关于SO的类似问题有10个答案为'强制删除吊舱'-_-

当然这是不可接受的,因为它会导致群集出现问题 - 太多的pod都停留在'终止'上,而且如果你试图删除一个随机的pod,很多时候它也会被卡住。它相当随机发生。

那么如何确定,首先是为什么要发出'终止'命令,然后再找出如何找到冻结背后的罪魁祸首。

是CNI吗?核心组件如kubelet,controllermanager?

日志没有显示任何有用的内容,也没有“描述pod”。

1 个答案:

答案 0 :(得分:1)

如果你的豆荚显然没有原因而终止,可能是:

  • 节点处于压力之下(内存,cpu)
  • 不尊重活跃状况

由于这些原因,调度程序会杀死一些pod。

如何确定确切的原因? 如果你找到了' logs'并且'描述'命令无用,它可能是一个有用的监控系统(例如,Influxdb + grafana:https://github.com/kubernetes/heapster/tree/master/deploy/kube-config/influxdb)。