GKE群集配置有群集/节点自动配置。
我创建了一个默认的节点池,可以在其上运行系统特定的Pod。每当请求带有GPU的Pod时,GKE都会自动创建启用GPU的新节点池。
但是,每当我删除此类Pod时,GKE都不会将新创建的节点池缩减为零实例。相反,一个实例保持运行。如果没有请求GPU,则节点池应该达到最小大小,即零。
注意:
我编辑了这个Daemonset,还添加了标签'“ cluster-autoscaler.kubernetes.io/safe-to-evict”:“ true” '到豆荚。
有人可以帮助将新创建的节点池缩减到零个节点吗?
更新:
在新节点上运行的Pod是:
fluentd-gcp(来自DaemonSet)
kube-proxy
nvidia-gpu-device-plugin(来自DaemonSet)
这些豆荚不是应该被逐出吗?
答案 0 :(得分:2)
默认情况下,GKE保留了额外的节点资源,可用于快速Pod调度。这是自动缩放策略控制的默认行为。
可以通过将策略设置为“优化利用”来更改此行为。
https://cloud.google.com/kubernetes-engine/docs/concepts/cluster-autoscaler