错误:NVIDIA-SMI失败,因为它无法与NVIDIA驱动程序通信

时间:2018-03-09 04:43:47

标签: gpu nvidia

NVIDIA-SMI正在抛出此错误:

  

NVIDIA-SMI失败了,因为它无法与NVIDIA通信   驱动程序。确保安装了最新的NVIDIA驱动程序   运行

我清除了NVIDIA并按照here提到的步骤重新安装了它。

我的设备规格如下:

  • 使用特斯拉M40的服务器
  • 在Ubuntu 16.04上运行
  • 内核版本Linux 4.4.0-116-generic x86_64
  • 司机:nvidia-384

有人可以帮忙解决错误吗?

4 个答案:

答案 0 :(得分:6)

问题可能是由于4.4.0-116补丁中确认的“错误”。我遇到了与nvidia-390相同的问题。如果您仍想使用较新版本的Nvidia驱动程序,我按照说明here设法解决了问题。通常,请使用以下步骤:

  1. 如果您无法登录桌面并进入故障循环,请按 ctrl + alt + F1 登录命令行模式。
  2. 检查gcc的版本是否过时,如果是,请更新它:gcc --version
  3. 如果gcc版本为5+,请先卸载nvidia驱动程序:sudo apt-get remove nvidia-390
  4. 清除4.4.0-116内核:sudo apt-get purge linux-headers-4.4.0-116 linux-headers-4.4.0-116-generic linux-image-4.4.0-116-generic linux-image-extra-4.4.0-116-generic linux-signed-image-4.4.0-116-generic
  5. 重新安装内核:sudo apt-get install linux-generic linux-signed-generic
  6. 重新安装nvidia-390:sudo apt-get install nvidia-390
  7. modinfo nvidia-390 -k 4.4.0-116-generic | grep vermagic检查问题是否已解决,确保此次出现 retpoline
  8. 重新启动:sudo reboot
  9. 希望这适用于您和遇到同一问题的其他人。论坛上的帖子节省了我的周末。

答案 1 :(得分:4)

尝试

  1. here
  2. 下载驱动程序
  3. sudo apt-get purge nvidia* - 删除当前的安装
  4. dpkg -i nvidia-diag-driver-local-repo-ubuntu1604_375.66-1_amd64.deb - 安装您之前下载的内容
  5. sudo apt-get update
  6. sudo apt-get install cuda-drivers
  7. 在此之后,继续并重新启动计算机。 当它再次启动时,nvidia-smi命令应该顺利运行

答案 2 :(得分:0)

从此答案开始下载最新的驱动程序:

    sudo apt install libnvidia-compute-435 libnvidia-compute-435
    sudo apt install libnvidia-gl-435 nvidia-dkms-435 nvidia-kernel-source-435         
    nvidia-utils-435 xserver-xorg-video-nvidia-435 libnvidia-ifr1-435 
    sudo apt install nvidia-driver-435
    sudo reboot

然后:

    nvidia-smi

答案 3 :(得分:0)

如果您要在Google Colab上运行此程序,只需转到运行时>更改运行时类型>选择GPU。那对我有用。