Question

我有一个k8s集群，其中有一个主机和一个工人。 Worker具有GPU，我可以使用GPU在其上调度pod。

我添加了第二个工作线程，也带有GPU。一切都已正确安装在该第二个工作器上。当我尝试在第二个工作线程上安排GPU busybox时，我的状态为UnexpectedAdmissionError。

使用kubectl describe pod busybox时，我看到Warning UnexpectedAdmissionError 7m kubelet, wikiserver Update plugin resources failed due to requested number of devices unavailable for nvidia.com/gpu. Requested: 1, Available: 0, which is unexpected.很奇怪，因为使用kubectl describe nodes second-worker时，我看到Capacity和Allocatable均为nvidia.com/gpu: 1

我能够在第一个工作线程上成功调度GPU busybox。另外，我还可以在两个工作线程上安排CPU busybox。

这是用于GPU busybox的yaml conf：

apiVersion: v1
kind: Pod
metadata:
  name: busybox
  namespace: default
spec:
  containers:
  - image: busybox
    command:
      - sleep
      - "3600"
    imagePullPolicy: IfNotPresent
    name: busybox
    resources:
        limits:
          nvidia.com/gpu: 1 
  restartPolicy: Always
  nodeName: secondworker

第二个工作程序（以及第一个工作程序和主服务器）的配置如nvidia-device-plugin所述。

Kubernetes nvidia-gpu UnexpectedAdmissionError

0 个答案: