Fairlry new,与kubernetes达成协议。如果这是非常基本的话,请道歉。
我已将复制设置为3的服务公开。
当CPU运行超过50%时,我使用minPods=2
和maxPods=6
对部署进行了自动调整。
NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE
my-api Deployment/ewealth-stocks-api <unknown> / 50% **2 6 3** 2m
以上配置有什么作用?当CPU处于阈值范围内且何时超过阈值时,可以使用多少个pod?感谢。
答案 0 :(得分:0)
据我了解,您希望根据CPU的使用情况使用Horizontal Pod Autoscaler。
因此,HPA基本上会根据CPU负载复制pod。这意味着当CPU负载大于50%时,增加pod的副本数量直到6.当CPU负载减少时,保持pod 2的副本数量。
由于不以任何方式控制负载量,可能会发生最终副本数量不同于2到6的情况。
HPA将增加和减少副本数量(通过部署),以保持所有Pod的平均CPU利用率达到50% 如果要检查CPU使用情况和窗格数,请使用以下命令
kubectl get hpa
kubectl describe hpa HPA_NAME
我附上了一个供进一步理解的链接,提供了一个示例。