我正在使用KOPS构建的Kubernetes集群在GCE中进行多个实验。我可以开始实验,验证它们是否正在运行,然后在运行结束时,负责为群集生成负载的节点的“ MemoryPressure”,“ DiskPressure”和“ Ready”状态为“未知”类型。
巧合的是,在运行结束时,在节点上运行的Pod也需要最多的资源。
所以我的问题是,由于生成负载,该节点是否可能无法响应来自kube-controller或api-server的请求?
如果是,该如何解决?从那时起,我的实验可能会使节点最长响应约半小时或更长时间。
感谢您的任何提前答复。
答案 0 :(得分:0)
如果由于Pod数量的增加而使负载增加,则可以尝试使用Node自动缩放。 Here,您可以找到有关的说明。
如果只有几个Pod消耗了所有Node资源,那么唯一的方法就是使用CPU和内存量更大的Nodes
答案 1 :(得分:0)
原来,我的一个Pod正在消耗节点上的所有CPU。使kubelte变得无响应。我已经设置了Pod的CPU时间限制,从而解决了该问题。另外,添加了保留kube的设置,以确保kubelet获得所需的CPU时间。