我们在GKE上运行了几个集群,直到现在我只维护了pod的CPU请求/限制。我们最近遇到了一些问题,当pod开始被驱逐以获得低内存时,集群自动调节没有响应,我们可以在GKE控制台中明显看到至少有一个节点存在内存压力。
我希望有人能告诉我:我们可以作出一些计算,作为我们应该为每个服务的每个pod请求/限制多少内存的起点,或者是更多的试验/错误?是否有一些统计服务可以跟踪群集中正在使用的内容?
谢谢!
答案 0 :(得分:5)
计算限制没有神奇的技巧。您需要从合理的限制开始,并使用反复试验进行改进。
我可以推荐来自YouTube的视频,该视频可以很好地解释一种优化限制的方法:https://youtu.be/-lsJyni7EQA
基本上它建议从低限制开始并对应用程序(一个pod实例)进行负载测试,直到它中断。 然后,再次提高限制并加载测试,直到找到好的值。