我有一个k8s集群,其中有一个主机和一个工人。 Worker具有GPU,我可以使用GPU在其上调度pod。
我添加了第二个工作线程,也带有GPU。一切都已正确安装在该第二个工作器上。当我尝试在第二个工作线程上安排GPU busybox时,我的状态为UnexpectedAdmissionError
。
使用kubectl describe pod busybox
时,我看到Warning UnexpectedAdmissionError 7m kubelet, wikiserver Update plugin resources failed due to requested number of devices unavailable for nvidia.com/gpu. Requested: 1, Available: 0, which is unexpected.
很奇怪,因为使用kubectl describe nodes second-worker
时,我看到Capacity和Allocatable均为nvidia.com/gpu: 1
我能够在第一个工作线程上成功调度GPU busybox。另外,我还可以在两个工作线程上安排CPU busybox。
这是用于GPU busybox的yaml conf:
apiVersion: v1
kind: Pod
metadata:
name: busybox
namespace: default
spec:
containers:
- image: busybox
command:
- sleep
- "3600"
imagePullPolicy: IfNotPresent
name: busybox
resources:
limits:
nvidia.com/gpu: 1
restartPolicy: Always
nodeName: secondworker
第二个工作程序(以及第一个工作程序和主服务器)的配置如nvidia-device-plugin所述。