Google(GKE)中的Kubernetes集群正在扩展节点

时间:2018-06-26 05:49:10

标签: kubernetes google-compute-engine google-kubernetes-engine

我在GCP中有一个Kubernetes集群,运行着几个启用了自动扩展的节点池。 好像自动缩放器过度缩放了... 附件是节点及其使用情况的列表(我使用的是32CPU机器类型)。

无法理解为什么自动缩放器不合并其中的某些机器,因为其使用量远远低于容量,并且可以轻松地将多台计算机上运行的Pod合并为一个。

我没有使用任何特殊的污点/亲和力,所以我看不到为什么会过度缩放。阅读节点自动定标器文档也无法解释这种行为。

列:状态,请求的CPU,总CPU,请求的RAM,总RAM

nodes list

1 个答案:

答案 0 :(得分:0)

正如您确认的关于kube-system pod的那样,您可能在节点中运行了一些kube-system pod,这阻止了自动缩放器删除节点。请参阅this

关于GKE下的cluster-autoscaler的日志,不幸的是,我认为您没有这种访问权限。如果您有权访问主计算机,请在/var/log/cluster-autoscaler.log中检查Cluster Autoscaler日志。 Cluster Autoscaler会记录许多有用的信息,包括为何认为Pod无法移动或其扩展计划是什么。有关更多信息,请查看this

请注意,节点未充分利用的可能性很大,但吊舱无法在其他任何地方使用,因此这可能是无法删除节点的原因。该逻辑记录在here中。

相关问题