如果执行cudaMalloc调用,则以下简单程序永不退出。只注释cudaMalloc会导致它正常退出。
#include <iostream>
using std::cout;
using std::cin;
#include "cuda.h"
#include "cutil_inline.h"
void PrintCudaVersion(int version, const char *name)
{
int versionMaj = version / 1000;
int versionMin = (version - (versionMaj * 1000)) / 10;
cout << "CUDA " << name << " version: " << versionMaj << "." << versionMin << "\n";
}
void ReportCudaVersions()
{
int version = 0;
cudaDriverGetVersion(&version);
PrintCudaVersion(version, "Driver");
cudaRuntimeGetVersion(&version);
PrintCudaVersion(version, "Runtime");
}
int main(int argc, char **argv)
{
//CUresult r = cuInit(0); << These two lines were in original post
//cout << "Init result: " << r << "\n"; << but have no effect on the problem
ReportCudaVersions();
void *ptr = NULL;
cudaError_t err = cudaSuccess;
err = cudaMalloc(&ptr, 1024*1024);
cout << "cudaMalloc returned: " << err << " ptr: " << ptr << "\n";
err = cudaFree(ptr);
cout << "cudaFree returned: " << err << "\n";
return(0);
}
这是在Windows 7,CUDA 4.1驱动程序,CUDA 3.2运行时运行。我跟踪从main到CRT的返回到ExitProcess(),它从不返回(如预期的那样),但是进程永远不会结束。从VS2008我可以停止调试OK。从命令行,我必须杀死控制台窗口。
节目输出:
Init result: 0
CUDA Driver version: 4.1
CUDA Runtime version: 3.2
cudaMalloc returned: 0 ptr: 00210000
cudaFree returned: 0
我尝试使分配量太大,以至于cudaMalloc会失败。它做了并报告了一个错误,但程序仍然不会退出。所以它显然只与调用cudaMalloc有关,而不是分配内存的存在。
关于这里发生了什么的任何想法?
编辑:我在第二句中错了 - 我必须消除cudaMalloc和cudaFree以使程序退出。留下任何一个导致挂断。编辑:虽然有许多提及CUDA驱动程序版本向后兼容的事实,但当我将驱动程序恢复为V3.2时,这个问题就消失了。
答案 0 :(得分:1)
您似乎正在将驱动程序API(cuInit
)与运行时API(cudaMalloc
)混合使用。
我不知道幕后是否有任何有趣的事情发生(或应该发生),但你可以尝试的一件事就是删除cuInit
并看看会发生什么。