应用错误收集

时间：2018-11-26 18:58:40

标签： kubernetes status high-load

我正在使用KOPS构建的Kubernetes集群在GCE中进行多个实验。我可以开始实验，验证它们是否正在运行，然后在运行结束时，负责为群集生成负载的节点的“ MemoryPressure”，“ DiskPressure”和“ Ready”状态为“未知”类型。

巧合的是，在运行结束时，在节点上运行的Pod也需要最多的资源。

所以我的问题是，由于生成负载，该节点是否可能无法响应来自kube-controller或api-server的请求？

如果是，该如何解决？从那时起，我的实验可能会使节点最长响应约半小时或更长时间。

感谢您的任何提前答复。

答案 0 :(得分：0)

如果由于Pod数量的增加而使负载增加，则可以尝试使用Node自动缩放。 Here，您可以找到有关的说明。

如果只有几个Pod消耗了所有Node资源，那么唯一的方法就是使用CPU和内存量更大的Nodes

答案 1 :(得分：0)

原来，我的一个Pod正在消耗节点上的所有CPU。使kubelte变得无响应。我已经设置了Pod的CPU时间限制，从而解决了该问题。另外，添加了保留kube的设置，以确保kubelet获得所需的CPU时间。