我已经运行了Ubuntu 16.04,并在很久以前就安装了Nvidia驱动程序以及CUDA和cud。昨天服务器已重新启动,通过ssh登录后,我想使用nvidia-smi
检查GPU,但失败了。
错误消息为“ NVIDIA-SMI失败,因为它无法与NVIDIA驱动程序通信。请确保已安装并正在运行最新的NVIDIA驱动程序。”
服务器具有:
Ubuntu 16.04
Nvidia K80C X4
CUDA 9.0
有人遇到这个问题并且可以提供可能的解决方案吗?我真的不想重新安装驱动程序,因为它可能导致其他问题。
答案 0 :(得分:0)
此问题最终通过重新安装Nvidia GPU驱动程序得以解决。导致此错误的根本原因是服务器在使用GPU运行时由于电源不稳定而关闭。