nvidia-smi进程挂起,也不能用SIGKILL杀死

时间:2017-01-05 15:46:17

标签: linux linux-device-driver nvidia

我使用的是Ubuntu 14.04,CUDA工具包8,驱动程序版本367.48

当我发出nvidia-smi命令时,它会无限期挂起。 当我再次登录并尝试使用nvidia-smi来杀死kill -9 <PID>进程时,它就不会被杀死。 如果我发出另一个nvidia-smi命令,我发现两个进程都在运行 - 当然是从另一个shell进行登录时,因为它会像之前一样被卡住。

这可能是与驱动程序有关的问题吗? 这不是最新的,但仍然很新......

2 个答案:

答案 0 :(得分:6)

我通过在每次启动时

解决了这个问题

sudo nvidia-smi -pm 1

以上命令启用持久性模式。这个问题已经影响了nvidia司机超过两年,但他们似乎并没有兴趣修复它。它似乎与电源管理问题相关,在引入操作系统后,如果nvidia-persistenced服务启用了no-persistence-mode选项,GPU将节省电量,{{1} }命令将挂起等待在设备上再次控制的东西

答案 1 :(得分:1)

考虑到你的特殊情况,我会尝试重新安装它,就像生物提议的那样。

您是否尝试过sudo kill -9 <PID>?你可能有,但仍然把它放在那里。或者,也许做sudo kill -15 <PID>来终止它。根据你告诉我们的内容,好像你的司机陷入signal 1陷阱。

nvidia-smi在运行时会自发挂起似乎很奇怪,但问题可能在于未正确安装或未通过超级用户访问运行。

您是否尝试过使用:

service nvidia-smi status pgrep nvidia-smi ps -aux | grep nvidia-smi

获取当前状态?

无论如何,希望这会有所帮助。我会尝试卸载并重新安装或使用sudo apt --fix-broken来尝试修复损坏的软件包/驱动程序。

干杯!