我需要在GCP上部署GPU密集型任务。我想使用一个Node.js Docker映像并在该容器中运行一个Node.js服务器,该服务器侦听HTTP请求并按需运行Python图像处理脚本(每次接收到包含该映像的新HTTP请求时,进行处理)。我的理解是,我需要在具有静态公共IP地址的K8s群集之前部署一个负载平衡器,然后在每次收到新的HTTP请求时构建/启动容器?处理完成后,再销毁容器。容器再利用不是问题吗?之前我从未使用过K8,我想了解它的工作原理,阅读GKE文档后,这就是我对架构的想象。我在这里想念什么?
答案 0 :(得分:1)
按需运行Python图像处理脚本(每次收到包含要处理图像的新HTTP请求时)
此 可以在Kubernetes上解决,但这不是很常见的工作量。
最能解决您问题的项目是Knative,它具有按请求自动缩放功能。 Google Cloud Run是使用它的最简单方法。但是,如果要在自己的GKE群集中运行此程序,则可以enable it。
也就是说,您可以还可以将Node.js服务设计为与Kubernetes API服务器集成以创建Jobs-但是进行常见的工作负载讨论并不是一个好的设计到API服务器。最好使用Knative或Google Cloud Run。