我使用的是Ubuntu 14.04,CUDA工具包8,驱动程序版本367.48 。
当我发出nvidia-smi
命令时,它会无限期挂起。
当我再次登录并尝试使用nvidia-smi
来杀死kill -9 <PID>
进程时,它就不会被杀死。
如果我发出另一个nvidia-smi
命令,我发现两个进程都在运行 - 当然是从另一个shell进行登录时,因为它会像之前一样被卡住。
这可能是与驱动程序有关的问题吗? 这不是最新的,但仍然很新......
答案 0 :(得分:6)
我通过在每次启动时
解决了这个问题 sudo nvidia-smi -pm 1
以上命令启用持久性模式。这个问题已经影响了nvidia司机超过两年,但他们似乎并没有兴趣修复它。它似乎与电源管理问题相关,在引入操作系统后,如果nvidia-persistenced
服务启用了no-persistence-mode
选项,GPU将节省电量,{{1} }命令将挂起等待在设备上再次控制的东西
答案 1 :(得分:1)
考虑到你的特殊情况,我会尝试重新安装它,就像生物提议的那样。
您是否尝试过sudo kill -9 <PID>
?你可能有,但仍然把它放在那里。或者,也许做sudo kill -15 <PID>
来终止它。根据你告诉我们的内容,好像你的司机陷入signal 1
陷阱。
nvidia-smi
在运行时会自发挂起似乎很奇怪,但问题可能在于未正确安装或未通过超级用户访问运行。
您是否尝试过使用:
service nvidia-smi status
pgrep nvidia-smi
ps -aux | grep nvidia-smi
获取当前状态?
无论如何,希望这会有所帮助。我会尝试卸载并重新安装或使用sudo apt --fix-broken
来尝试修复损坏的软件包/驱动程序。
干杯!