无法在Ubuntu中使用来自CUDA的deviceQuery

时间:2015-06-26 16:39:29

标签: ubuntu cuda installation nvidia

当前操作系统是Ubuntu 14.04.02 LTS。我跟着http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/#ubuntu-installation安装了CUDA。但是,当我在安装后操作中使用deviceQuery时,它会显示以下消息:

cudaGetDeviceCount returned 38
-> no CUDA-capable device is detected
Result = FAIL

安装指南说这可能是/ dev / nvidia *的一些问题,所以我运行/ dev $ ls -l nvidia *:

crw-rw-rw- 1 root root 195,   0  6月 25 20:58 nvidia0
crw-rw-rw- 1 root root 195, 255  6月 25 20:58 nvidiactl

还有nvidia-smi -a:

Failed to initialize NVML: GPU access blocked by the operating system

现在我不知道出了什么问题。任何人都可以给我一个建议吗?

1 个答案:

答案 0 :(得分:4)

我的图片卡: 1.特斯拉K40 2. Quadro FX580

我也有同样的问题,花了我几个小时才弄明白。我的解决方案是你可能需要将你的CUDA从7.0降低到6.5甚至更高到5.5。

由于某些未知原因,您的图形卡(其中一个)仅适用于346以下的Nvidia驱动程序版本,例如340版本。但是,对于CUDA 7.0 / 6.5,你需要346.这个问题自相矛盾。我遇到过这种情况,并且有无限的登录循环问题(基本上,无法登录到我的电脑)。

你做的是:

  1. 如果您无法登录GUI,请按 Ctrl + Alt + F1 / F3 进入命令行。
  2. 在终端中,登录。然后输入sudo apt-get install nvidia-cuda-toolkit。 (这将安装驱动程序版本340,它可以帮助您解决无限登录屏幕问题< - 但是这不允许您使用Cuda7.0,我相信)。
  3. 一旦您能够登录,cd /usr/local - > rm -rf cuda7.0
  4. sudo apt-get install cuda6.5(他们会强制您再次安装版本346)。
  5. sudo apt-get install nvidia-340(一个较低级别的驱动程序;当你安装它时,它会删除cuda6.5和其他一些文件,但不是全部)
  6. nvidia-smi< - 您现在应该可以看到两张显卡。但是,你缺少cuda
  7. nvcc< - 这应该给你错误和建议的解决方案。类似于"键入sudo apt-get install nvidia-cuda-toolkit"。按照它,您应该能够安装cuda5.5
  8. 现在,至少你可以使用cuda5.5一张好的图形卡和一张坏的图形卡。
  9. 注意:您可能会输入gcc出现问题的问题。例如,他们可能不接受gcc4.8.2但接受gcc4.8.4。请注意这一点。

    雅,有时候,遇到这种矛盾的问题是令人沮丧的,其中驱动程序不支持一张卡但不支持另一张卡而且还有其他依赖关系。我需要很长时间来解决这个问题。希望这有帮助!

    2015年3月10日更新。

    所以,我用Cuda5.5尝试了caffe。它出现了非常奇怪的问题,我认为这是因为cuda版本太低了。所以,我试图再次更新到6.5。所以,我在此之后成功安装了cuda6.5:

    1. 预安装340.93 Nvidia驱动程序。
    2. 下载cuda6.5 https://developer.nvidia.com/cuda-toolkit-65
    3. 确认您使用的是gcc 4.4.7。 gcc 4.8.4赢了。按照此操作:https://askubuntu.com/questions/26498/choose-gcc-and-g-version
    4. 安装您为cuda下载的.run文件。确保不要安装安装程序建议的驱动程序340.29。
    5. 安装后全部设置,执行sudo nvidia-smi以确保其运行。重启。完成。
    6. 这适用于我的计算机ubuntu 14.04与Tesla K40c和Quadro FX580。