应用错误收集

根据需求使用gpu扩展部署

时间：2019-06-18 17:22:16

标签： kubernetes gpu autoscaling

我目前正在部署GPU实例，并按占空比对其进行扩展。但这不是一个很好的指标。

我们有一个使用gpu的部署。它公开了一个REST API，其他作业/豆荚可以在其中使用它进行推理。如何使用HPA有效地缩放比例？基于哪个指标？

当前，我正在尝试使用占空比指标，但是它不是很可靠。

编辑：否，这个问题不是Autoscaling based on GPU utilization?的重复。我正在搜索设置自动缩放的kubernetes指标。

0 个答案:

没有答案