我如何知道OpenCL

时间:2016-12-12 01:58:00

标签: java parallel-processing opencl gpgpu

我是OpenCL的新手。 目前我正在研究一个大的一维数组。阵列的大小约为800万。以下是我的代码的一部分:

//allocate opencl hosted memory for input
int[] Counts = new int[8000000];

//get device and create context....

CLBuffer<Integer> memIn1 = context.createIntBuffer(Usage.Input, 8000000);   
Pointer<Integer> a = memIn1.map(queue, MapFlags.Write);
a.setInts(Counts);

//memory allocation for the second parameter memIn2

CLKernel kernel = program.createKernel("gpuScoring", memIn1, memIn2, 8000000, memOut);
kernel.enqueueNDRange(queue, new int[] {8000000}, null);

以下是我的内核代码:

__kernel void gpuScoring(__global int *Counts, __global int *value, int width, int height, __global int *output){

    int gid = get_global_id(0);
    int x = gid % width;
    int y = gid / width;
    int count = Counts[y * width + x];
    if(count != 0){
        //need to do something here...
    }   
}

然而,问题是我发现我永远不能进入if的真正分支(count!= 0)。我很确定我的Java代码中的Counts数组有一些不是0的索引值。是不是因为我错误地使用了内存映射?请帮忙。谢谢。

1 个答案:

答案 0 :(得分:0)

映射缓冲区后,必须在那里写入数据,然后取消映射。您的使用更像是创建缓冲区并将主机数据复制到缓冲区。