应用错误收集

时间：2018-03-07 18:29:29

标签： kubernetes google-kubernetes-engine

我们在GKE上运行了几个集群，直到现在我只维护了pod的CPU请求/限制。我们最近遇到了一些问题，当pod开始被驱逐以获得低内存时，集群自动调节没有响应，我们可以在GKE控制台中明显看到至少有一个节点存在内存压力。

我希望有人能告诉我：我们可以作出一些计算，作为我们应该为每个服务的每个pod请求/限制多少内存的起点，或者是更多的试验/错误？是否有一些统计服务可以跟踪群集中正在使用的内容？

谢谢！

答案 0 :(得分：5)

计算限制没有神奇的技巧。您需要从合理的限制开始，并使用反复试验进行改进。

我可以推荐来自YouTube的视频，该视频可以很好地解释一种优化限制的方法：https://youtu.be/-lsJyni7EQA

基本上它建议从低限制开始并对应用程序（一个pod实例）进行负载测试，直到它中断。然后，再次提高限制并加载测试，直到找到好的值。