Question

我正在尝试使用dlsym在运行时加载cuda驱动程序api函数，我遇到了一个奇怪的错误。我有这个代码在我的系统上顺利运行（用nvcc等编译）：

#include <cuda.h>
#include <stdio.h>

int main(int argc,char *argv[]){

  if(argc<3){
    printf("Usage: ./test.cu <ptx_file> <cuda_device>\n");
    exit(0);
  }

  // Error code
  CUresult error;

  // My number
  unsigned int h_var=7;

  // Initialize driver API
  error = cuInit(0);
  if((int)error!=0){
    printf("Error! cuInit returned: %d\n",(int)error); 
    exit(0);
  }

  // Get Cuda Device and give handle
  CUdevice cu_device;
  error = cuDeviceGet(&cu_device,atoi(argv[2]));
  if((int)error!=0){
    printf("Error! cuDeviceGet returned: %d\n",(int)error);
    exit(0);
  }

  // Create context to run on device 
  CUcontext cu_context;
  error = cuCtxCreate(&cu_context, 0, cu_device);
  if((int)error!=0){
    printf("Error! cuCtxCreate returned: %d\n",(int)error);
    exit(0);
  }

  // Load ptx code
  CUmodule cu_module;
  error = cuModuleLoad(&cu_module,argv[1]);
  if((int)error!=0){
    printf("Error! cuModuleLoad returned: %d\n",(int)error);
    exit(0);
  }

  // Get kernel function
  CUfunction func;
  error = cuModuleGetFunction(&func,cu_module,"testing"); 
  if((int)error!=0){
    printf("Error! cuModuleGetFunction returned: %d\n",(int)error);
    exit(0);
  }

  CUdeviceptr var;

  // Allocate device memory
  unsigned int size = sizeof(unsigned int);
  error = cuMemAlloc(&var, size);
  if((int)error!=0){
    printf("Error! cuMemAlloc returned: %d\n",(int)error);
    exit(0);
  }

  // Copy variable to host
  error = cuMemcpyHtoD(var,&h_var,size);
  if((int)error!=0){
    printf("Error! cuMemcpyHtoD returned: %d\n",(int)error);
    exit(0);
  }

  // Lauch kernel
  void *args[] = {&var};
  error = cuLaunchKernel(func, 1, 1, 1, 1, 1, 1, 0, NULL, args, NULL);
  if((int)error!=0){
    printf("Error! cuLaunchKernel returned: %d\n",(int)error);
    exit(0);
  }

  // Get result to host
  error = cuMemcpyDtoH(&h_var,var,size);
  if((int)error!=0){
    printf("Error! cuMemcpyDtoH returned: %d\n",(int)error);
    exit(0);
  }

  // Free device memory
  error = cuMemFree(var);
  if((int)error!=0){
    printf("Error! cuMemFree returned: %d\n",(int)error);
    exit(0);
  }

  // Destroy context
  error = cuCtxDestroy(cu_context);
  if((int)error!=0){
    printf("Error! cuCtxDestroy returned: %d\n",(int)error);
    exit(0);
  }

  // Print result
  printf("var: %d\n",h_var);
}

使用我编写的ptx代码:(这是一个简单的添加，只是为了测试它的工作原理）

.version 1.4 .target sm_10，map_f64_to_f32

.entry testing (
  .param .u64 mynum)
{

  .reg .u64 %r;
  .reg .u64 %i;
  ld.param.u64 %r,[mynum];
  ld.global.u64 %i,[%r];
  add.u64 %i,%i,3;
  st.global.u64 [%r+0],%i;
  exit;

}

到目前为止一切顺利。然后我拿了代码并用dlsym加载每个函数，如下所示：

  /* Lauch kernel */
  void *args[] = {&var};
  int (*_cuLaunchKernel)( void *, unsigned int, unsigned int, unsigned int, unsigned int, unsigned int, unsigned int, unsigned int, void *, void **, void ** );
  *(void **)(&_cuLaunchKernel) = dlsym(dlhandle, "cuLaunchKernel");
  (*_cuLaunchKernel)(cu_func,1 , 1, 1, 1, 1, 1, 0, NULL, args, NULL);


 /* Get result to host  */
  int (*_cuMemcpyDtoH)( void *, void *, size_t );
  *(void **)(&_cuMemcpyDtoH) = dlsym(dlhandle, "cuMemcpyHtoD");
  error = (*_cuMemcpyDtoH)(&h_var,var,size);

（其余代码采用相同的逻辑）。我的所有函数都返回0，表示一切正常，除了最后一个_cuMemcpyDtoH，它返回错误1（= cudaErrorMissingConfiguration）。有人可以解释这个错误意味着什么，以及它为什么会发生？有办法解决吗？为什么当我在运行时加载函数时它会出现？

感谢。

我的系统： nvcc发布4.1 GPU：GTX 480 NVRM版本：NVIDIA UNIX x86_64内核模块285.05.32 GCC版本：gcc版本4.5.2（Ubuntu / Linaro 4.5.2-8ubuntu4）

Answer 1

对于您使用的驱动程序API，错误代码1表示CUDA_ERROR_INVALID_VALUE

出现此错误的原因是：

*(void **)(&_cuMemcpyDtoH) = dlsym(dlhandle, "cuMemcpyHtoD");

---您正在尝试使用错误的功能：HtoD而不是DtoH。

Cuda驱动程序调用返回错误1（cudaErrorMissingConfiguration）

1 个答案: