我正在使用带有CUDA 4.2的Tesla 2075(cc 2.0)。我在非显示器 GPU(特斯拉)上运行我的程序,我收到错误:
"the launch timed out and was terminated "
非显示GPU上是否会出现此错误?
而且,我怎么能禁用看门狗定时器?
答案 0 :(得分:4)
我假设你在Windows上运行。如果是这样,请将特斯拉2075放入TCC mode。这将允许计算访问,Windows不会像显示设备那样管理它,它将摆脱看门狗定时器。如果您在查找nvidia-smi时遇到问题,只需在Windows上搜索nvidia-smi.exe即可。 (它应该已经与显示驱动程序一起安装。)然后,如果C2075是系统中唯一的CUDA GPU,则命令将如下所示:nvidia-smi -g 0 -dm 1
您还可以执行nvidia-smi --help
来获取命令该工具的行帮助。更改此项后,可能需要重新启动系统才能使卡进入TCC模式。
另一方面,如果你在这台机器上运行linux和X-windows,解决方案会有所不同。一种方法是简单地禁用X,例如通过将运行级别设置为3并重新启动,但还有其他方法可以执行此操作。但是你会在另一个GPU上丢失你的X GUI(我假设你有另一个GPU,因为你说这是一个非显示GPU)。为了在其他GPU上保留X和GUI,有必要修改xorg.conf文件以强制X进入显示器GPU并将其从计算机(特斯拉)GPU中取出。执行此操作的方法会有所不同,但如果您有2个NVIDIA GPU(一个用于显示),则应使用xorg.conf文件的相关“显示”部分中的BusID参数将X显示强制到单个GPU上。此外,应删除任何其他“显示”部分。例如:
BusID “PCI:34:0:0”
GPU的PCI ID可以从lspci
命令或nvidia-smi –a
命令确定。
您可能还希望参考NVIDIA驱动程序X configuration options appendix的README file。