标签: autoscaling knative-serving knative
我有一个服务,该服务接收完成时间差异很大的请求,例如可以要求处理5mb视频或2gb视频,并且两者都将被视为一个请求。 但是同时可能会闲置几个小时并浪费大量RAM。 有没有一种方法可以配置Knative服务,该服务可以基于CPU自动缩放(如果可以基于GPU缩放甚至更好),但同时在Knative的默认http自动缩放的5分钟无请求功能后将缩放比例设置为0?