Question

Fairlry new，与kubernetes达成协议。如果这是非常基本的话，请道歉。

我已将复制设置为3的服务公开。当CPU运行超过50％时，我使用minPods=2和maxPods=6对部署进行了自动调整。

NAME                 REFERENCE                       TARGETS           MINPODS   MAXPODS   REPLICAS   AGE

my-api   Deployment/ewealth-stocks-api   <unknown> / 50%   **2         6         3**          2m

以上配置有什么作用？当CPU处于阈值范围内且何时超过阈值时，可以使用多少个pod？感谢。

Answer 1

据我了解，您希望根据CPU的使用情况使用Horizontal Pod Autoscaler。

因此，HPA基本上会根据CPU负载复制pod。这意味着当CPU负载大于50％时，增加pod的副本数量直到6.当CPU负载减少时，保持pod 2的副本数量。

由于不以任何方式控制负载量，可能会发生最终副本数量不同于2到6的情况。

HPA将增加和减少副本数量（通过部署），以保持所有Pod的平均CPU利用率达到50％如果要检查CPU使用情况和窗格数，请使用以下命令

kubectl get hpa

kubectl describe hpa HPA_NAME

我附上了一个供进一步理解的链接，提供了一个示例。

horizontal-pod-autoscale-walkthrough

kubernetes autoscale minPods vs replicas

1 个答案: