我正在使用我的GPU(Tesla K80)使用张量流来训练神经网络,并且出了点问题。当我键入2017-11-13_20_58_16-5812097262489045871
时,我看到正在使用nvidia-smi
内存,但没有列出GPU的进程。
通常情况下,当发生这种情况时,我可以输入11239MiB / 11439MiB
并查找正在耗尽GPU的进程,但这次没有任何事情发生。
如何弄清楚GPU上运行的是什么,以及如何杀死它?
答案 0 :(得分:1)
查看使用GPU的用户正在运行的所有进程。杀死可能使用过GPU的所有进程。
ps -ef | grep <username>
您也可以尝试
sudo nvidia-smi --gpu-reset
如果无效,请考虑重新启动。