由于MatchInterPodAffinity谓词,没有任何亲和力的Kubernetes pod突然停止调度

时间:2017-07-16 20:11:05

标签: amazon-web-services amazon-ec2 kubernetes kops

我们的Kubernetes 1.6群集中没有任何已知的更改,所有新的或重新启动的pod都不再安排。我得到的错误是:

No nodes are available that match all of the following predicates:: MatchInterPodAffinity (10), PodToleratesNodeTaints (2).

我们的群集之前工作正常,我真的看不到在此之前所做的任何配置更改。

我已经尝试过的事情:

  • 重新启动主节点
  • 重新启动kube-scheduler
  • 删除受影响的广告连播,部署,有状态集

某些播放器确实具有以前可用的反关联设置,但大多数播放设备没有任何关联设置。

群集信息:

  • Kubernetes 1.6.2
  • Kops on AWS
  • 1个主节点,8个主节点,1个受污染的数据处理节点

这有什么原因吗?

我可以查看哪些设置和日志可以提供更多信息?

是否有可能调试调度程序?

1 个答案:

答案 0 :(得分:1)

问题是Pod被删除了。这导致kube-controller-manager停止工作。

删除无效,因为有问题的Pod / RS / Deployment的限制与我们在创建后设置的maxLimitRequestRatio冲突。错误报告即将发布。

解决方案是增加maxLimitRequestRatio并最终重启kube-controller-manager。