根据需求使用gpu扩展部署

时间:2019-06-18 17:22:16

标签: kubernetes gpu autoscaling

我目前正在部署GPU实例,并按占空比对其进行扩展。但这不是一个很好的指标。

我们有一个使用gpu的部署。它公开了一个REST API,其他作业/豆荚可以在其中使用它进行推理。如何使用HPA有效地缩放比例?基于哪个指标?

当前,我正在尝试使用占空比指标,但是它不是很可靠。

编辑:否,这个问题不是Autoscaling based on GPU utilization?的重复。我正在搜索设置自动缩放的kubernetes指标。

0 个答案:

没有答案