在OpenCL中设置内核中的参数会导致错误

时间:2015-07-01 11:03:55

标签: c linux parallel-processing opencl gpgpu

我是OpenCL的初学者,因此编写了一个简单的程序来加倍数组的元素。 内核代码是: -

__kernel void dataParallel(__global int* A, __global int* B)
{
    int base = get_local_id(0);
    B[base]=A[base]+A[base];
}

local_work_size = 32,因为我正在调整32个元素。

在我的程序中,我声明了一个整数数组,它保存了要平方的元素。

int *A;
A=(int*)malloc(sizeof(int)*64);
for (i=0; i < 32; i++) {            A[i] = i;   }

platforms[i]存储平台ID,devices[j]存储相应的设备ID。他们的类型:

cl_platform_id* platforms;
cl_device_id* devices;

创建上下文

cl_context context=clCreateContext(NULL,1,&devices[j],NULL,NULL,NULL);

接下来是命令队列

cl_command_queue cmdqueue=cmdqueue=clCreateCommandQueue(context,devices[j],NULL,&err);

接下来,我创建了2个内存缓冲区,一个用于保存输入数据,另一个用于保存结果。

cl_mem  Abuffer,Bbuffer;
Abuffer=clCreateBuffer(context, CL_MEM_READ_WRITE ,32*sizeof(int),NULL,&err);
Bbuffer=clCreateBuffer(context, CL_MEM_READ_WRITE ,32*sizeof(int),NULL,&err);

然后我将数组A的数据复制到Abuffer

ret=clEnqueueWriteBuffer(cmdqueue, Abuffer, CL_TRUE, 0, 32*sizeof(int), A, 0, NULL, NULL);
printf("%d",ret);//output is 0 thus data written successfully into the buffer

然后将内核代码读入字符串source_str并创建程序。

kernelprgrm=clCreateProgramWithSource(context,1,(const char **)&source_str,(const size_t *)&source_size,&err);
    if(!err)
    {
        printf("\nKernel program created successfully\n");
    }//Outputs -Kernel program created successfully

然后我使用以下方法构建了程序:

ret=clBuildProgram(kernelprgrm,1,&devices[j],NULL,NULL,NULL);//returns CL_SUCCESS

接下来获取buildinfo

ret=clGetProgramBuildInfo(kernelprgrm,devices[j], CL_PROGRAM_BUILD_STATUS ,0,NULL,&size);//Returns success

创建内核

kernel = clCreateKernel(kernelprgrm, "dataParallel", &ret);
    printf("\nReturn kernel program=%d",ret);
    if(!ret)
    {
        printf("\nProgram created successfully!\n");
    }
    //Outputs -Program created successfully!

魔鬼来了: -

ret=clSetKernelArg(kernel,0,sizeof(cl_mem),(void *) Abuffer);
printf("\nKernel argument 1 ret=%d",ret);

ret=clSetKernelArg(kernel,1,sizeof(cl_mem),(void *) Bbuffer);
printf("\nKernel argument 2 ret=%d",ret);

两者都返回 -38 ,意思是 CL_INVALID_MEM_OBJECT

P.S.:根据指出的错误,即在参数中使用&amp; Abuffer而不是Abuffer,并且在进行必要的更改后,都返回0

size_t global_item_size = 32;
size_t local_item_size = 32;

同样ret = clEnqueueNDRangeKernel(cmdqueue, kernel, 1, NULL,&global_item_size, &local_item_size, 0, NULL, NULL);返回 0

试图获得结果

ret = clEnqueueReadBuffer(cmdqueue, Bbuffer, CL_TRUE, 0, 32*sizeof(int), B, 0, NULL, NULL);` 
printf("\nB:-\n");
for (t=0; t < 32; t++) {
            printf("%d\t ", B[t]);
                }

这会返回buildstatus = 0,核心会被我的AMD GPU(运行AMD加速并行处理平台)和NVIDIA GPU转储,而如果所选设备是使用英特尔(R)OpenCL平台的CPU,它可以完全正常工作

此外,我尝试使用以下方式获取构建日志:

cl_build_status *status=(cl_build_status *)malloc(sizeof(cl_build_status )*size);
clGetProgramBuildInfo(kernelprgrm,devices[j], CL_PROGRAM_BUILD_STATUS ,size,status,NULL);
printf("\nBuild status=%d\n",*status);

//如果不成功则获取构建信息

clGetProgramBuildInfo(kernelprgrm,devices[i], CL_PROGRAM_BUILD_LOG ,0,NULL,&size);
char *buildlog=(char*)malloc(size);
clGetProgramBuildInfo(kernelprgrm,devices[i], CL_PROGRAM_BUILD_LOG ,size,buildlog,NULL);
printf("\n!!!!!!!!!!!!!!!!!!!!!Program ended!!!!!!!!!!!\n");
printf("\n\nBuildlog:   %s\n\n",buildlog);

但它会返回Buildlog: Compilation started Compilation done Linking started Linking done Device build started Device build done Kernel <dataParallel> was successfully vectorized (4) Done.

2 个答案:

答案 0 :(得分:2)

以下是关于将缓冲区设置为内核参数的OpenCL 1.2规范所说的内容:

  

如果参数是内存对象(缓冲区,图像或图像数组),则arg_value条目将是指向相应缓冲区,图像或图像数组对象的指针。

因此,您需要将指针传递给cl_mem个对象:

ret=clSetKernelArg(kernel,0,sizeof(cl_mem),(void *) &Abuffer);

答案 1 :(得分:0)

为什么使用clEnqueueTask?我认为如果你有并行工作要使用clEnqueueNDRangeKernel。另外,只需设置全局工作量;为本地工作组大小传递NULL。 32x32比某些设备可以做的要大。