标签: kubernetes gpu autoscaling
我目前正在部署GPU实例,并按占空比对其进行扩展。但这不是一个很好的指标。
我们有一个使用gpu的部署。它公开了一个REST API,其他作业/豆荚可以在其中使用它进行推理。如何使用HPA有效地缩放比例?基于哪个指标?
当前,我正在尝试使用占空比指标,但是它不是很可靠。
编辑:否,这个问题不是Autoscaling based on GPU utilization?的重复。我正在搜索设置自动缩放的kubernetes指标。