GKE不会将节点缩减为零

时间:2020-03-30 13:04:17

标签: kubernetes google-cloud-platform google-kubernetes-engine autoscaling

GKE群集配置有群集/节点自动配置。

我创建了一个默认的节点池,可以在其上运行系统特定的Pod。每当请求带有GPU的Pod时,GKE都会自动创建启用GPU的新节点池。

但是,每当我删除此类Pod时,GKE都不会将新创建的节点池缩减为零实例。相反,一个实例保持运行。如果没有请求GPU,则节点池应该达到最小大小,即零。

注意:

  • 对于GPU驱动程序,已在“ kube-system”命名空间下创建了一个Daemonset,该Daemonset的Pod在每个启用GPU的节点上运行。

我编辑了这个Daemonset,还添加了标签'“ cluster-autoscaler.kubernetes.io/safe-to-evict”:“ true” '到豆荚。

有人可以帮助将新创建的节点池缩减到零个节点吗?

更新:

在新节点上运行的Pod是:

fluentd-gcp(来自DaemonSet)

kube-proxy

nvidia-gpu-device-plugin(来自DaemonSet)

这些豆荚不是应该被逐出吗?

1 个答案:

答案 0 :(得分:2)

默认情况下,GKE保留了额外的节点资源,可用于快速Pod调度。这是自动缩放策略控制的默认行为。

可以通过将策略设置为“优化利用”来更改此行为。

https://cloud.google.com/kubernetes-engine/docs/concepts/cluster-autoscaler