kubernetes - 在非 AWS Kubernetes 集群上使用 aws-virtual-gpu-device-plugin

请注意其局限性。

Virtual GPU device plugin for Kubernetes

<块引用>

块引用限制该解决方案建立在 Volta 多进程服务 (MPS) 之上。您只能在 Tesla-V100 或更高版本的实例类型上使用它。（现在只有 Amazon EC2 P3 实例和 Amazon EC2 G4 实例）虚拟 GPU 设备插件默认设置 GPU 计算模式为 EXCLUSIVE_PROCESS，这意味着 GPU 被分配给 MPS 进程，单个进程线程可以通过 MPS 服务器并发提交工作到 GPU。此 GPU 不能用于其他目的。如果您在工作负载中请求 k8s.amazonaws.com/vgpu 超过 1，则仅在单个物理 GPU 实例（如 P3.2xlarge）上使用虚拟 GPU 设备插件。虚拟 GPU 设备插件不能与 Nvidia 设备插件一起使用。您可以标记节点并使用选择器安装虚拟 GPU 设备插件。

在非 AWS Kubernetes 集群上使用 aws-virtual-gpu-device-plugin

1 个答案: