可以通过将环境变量“CUDA_ENABLE_COREDUMP_ON_EXCEPTION”设置为“1”来生成GPU coredump。当不使用MPS时,成功生成coredump。但是使用MPS,生成的coredump文件大小小于没有MPS的此文件的大小。我怀疑在完全生成coredump之前MPS服务器已经退出。我们有什么办法可以用MPS获得完整的GPU coredump吗?
Cuda工具包版本:8.0 驱动程序版本:375.26 GPU架构:特斯拉P100(Pascal)
答案 0 :(得分:1)
在Volta生成之前,GPU中没有MPS + CUDA Coredump功能 Volta为MPS引入了一些改变,使其成为可能。
NVIDIA将在未来更新MPS文档,以记录此限制。