Question

昨天我重新创建了一个集群，因此它对于主节点和节点都有1.1.7版本。在部署第一个服务之后，它不再像以前那样可以运行。

我无法进入节点。部署失败，出现FailedScheduling错误。 Kube UI因以下响应而失败。

{
  "kind": "Status",
  "apiVersion": "v1",
  "metadata": {},
  "status": "Failure",
  "message": "no endpoints available for service \"kube-ui\"",
  "reason": "ServiceUnavailable",
  "code": 503
}

重置节点对此没有帮助。任何可能导致这种情况的想法？

Answer 1

对于任何想知道问题原因的人，我们在群集中添加了更多虚拟机，并在每个吊舱上设置资源请求/限制，以防止整个群集耗尽资源。这似乎解决了它。亚历克斯，再次感谢你的帮助。

Answer 2

听起来群集的节点都是不健康的。这可以解释没有kube-ui pod运行，以及调度错误。无法通过SSH进入它们是非常奇怪的。

kubectl get nodes和kubectl get node NODENAME -o yaml（替换其中一个节点名称的NODENAME）会返回什么？

容器引擎集群版本1.1.7节点不可用

2 个答案: