昨天我重新创建了一个集群,因此它对于主节点和节点都有1.1.7版本。在部署第一个服务之后,它不再像以前那样可以运行。
我无法进入节点。部署失败,出现FailedScheduling错误。 Kube UI因以下响应而失败。
{
"kind": "Status",
"apiVersion": "v1",
"metadata": {},
"status": "Failure",
"message": "no endpoints available for service \"kube-ui\"",
"reason": "ServiceUnavailable",
"code": 503
}
重置节点对此没有帮助。任何可能导致这种情况的想法?
答案 0 :(得分:2)
对于任何想知道问题原因的人,我们在群集中添加了更多虚拟机,并在每个吊舱上设置资源请求/限制,以防止整个群集耗尽资源。这似乎解决了它。 亚历克斯,再次感谢你的帮助。
答案 1 :(得分:1)
听起来群集的节点都是不健康的。这可以解释没有kube-ui pod运行,以及调度错误。无法通过SSH进入它们是非常奇怪的。
kubectl get nodes
和kubectl get node NODENAME -o yaml
(替换其中一个节点名称的NODENAME)会返回什么?