我目前正在尝试运行PyTorch深度学习模型。当我尝试将数据放在CUDA设备顶部时,出现错误:
*** RuntimeError: CUDA error: device-side assert triggered
我尝试设置pdb.set_trace()
并发现,每当尝试执行data.cuda()
时,我都会收到错误消息。是否有人知道原因可能是什么,如果知道,我将来如何解决并防止它发生?谢谢。
此外,我运行了nvidia-smi
命令,一切正常。 CUDA版本与驱动程序匹配,PyTorch版本与CUDA版本匹配,并且GPU上的内存足够多。