我正在Google Kubernetes Engine上使用Cloud Run,并且能够毫无问题地部署和访问服务。
但是,由于我正在GKE上运行并为24/7集群付费,因此将部署扩展到零并始终对第一个请求始终保持冷启动是没有意义的。
我发现可以为Knative自动缩放器设置minScale
以将缩放比例禁用为零here,here和here,但是我不知道在哪里放上它。
在GKE中,用于Isito和Knative-Serving的配置,服务和工作负载很多,但是我找不到匹配的东西。
我需要编辑哪个文件或配置才能将minScale
设置为1
?还是因为Cloud Run在内部管理特定模板,所以这不可能吗?
答案 0 :(得分:2)
使用kubectl
,您应该可以在您的Knative服务上设置注释autoscaling.knative.dev/minScale: "1"
。
有关更多信息,请参见this page