Kubernetes nvidia-gpu UnexpectedAdmissionError

时间:2019-03-26 14:11:54

标签: kubernetes gpu nvidia

我有一个k8s集群,其中有一个主机和一个工人。 Worker具有GPU,我可以使用GPU在其上调度pod。

我添加了第二个工作线程,也带有GPU。一切都已正确安装在该第二个工作器上。当我尝试在第二个工作线程上安排GPU busybox时,我的状态为UnexpectedAdmissionError

使用kubectl describe pod busybox时,我看到Warning UnexpectedAdmissionError 7m kubelet, wikiserver Update plugin resources failed due to requested number of devices unavailable for nvidia.com/gpu. Requested: 1, Available: 0, which is unexpected.很奇怪,因为使用kubectl describe nodes second-worker时,我看到Capacity和Allocatable均为nvidia.com/gpu: 1

我能够在第一个工作线程上成功调度GPU busybox。另外,我还可以在两个工作线程上安排CPU busybox。

这是用于GPU busybox的yaml conf:

apiVersion: v1
kind: Pod
metadata:
  name: busybox
  namespace: default
spec:
  containers:
  - image: busybox
    command:
      - sleep
      - "3600"
    imagePullPolicy: IfNotPresent
    name: busybox
    resources:
        limits:
          nvidia.com/gpu: 1 
  restartPolicy: Always
  nodeName: secondworker

第二个工作程序(以及第一个工作程序和主服务器)的配置如nvidia-device-plugin所述。

0 个答案:

没有答案