OOM之后Kubernetes休息了

时间:2017-05-25 11:40:21

标签: kubernetes

我在主节点上的OOM之后遇到了Kubernetes的问题。 Kubernetes服务看起来很好,日志中没有任何错误或警告消息。但是Kubernetes未能处理新的部署,这是在OOM发生后创建的。

我按systemctl restart kube-*重新加载了Kubernetes。它解决了这个问题,Kubernetes开始正常工作。

我只是想知道Kubernetes中的预期行为或错误?

2 个答案:

答案 0 :(得分:1)

如果您可以共享kube-controller的日志,那就太棒了。但是当api服务器崩溃/ OOMKilled时,kubernetes的早期版本中可能存在潜在的同步问题(我记得我们看到了daemonset的类似问题,并且我向Kubernete社区提交了bug),但很少见。

与此同时,我们做了很多努力使kubernetes生产准备就绪:调整kubernetes和制作需要与kubernetes交谈的其他微服务。希望这些博客条目有所帮助:

https://applatix.com/making-kubernetes-production-ready-part-2/这是我们用来调整kubernetes的大约30多个旋钮

https://applatix.com/making-kubernetes-production-ready-part-3/这是关于确保群集稳定性的微服务行为

答案 1 :(得分:0)

似乎问题不是由OOM引起的。无论OOM是否发生,都是由kube-controller引起的。

如果我重新启动kube-controller,Kubernetes会正常开始流程部署和pod。