OpenCL原子什么都不做

时间:2013-02-24 16:58:50

标签: c opencl gpgpu atomic

我尝试使用OpenCL编写一个示例直方图工具。首先,我只是强调以原子方式递增每个bin。我提出了以下内核代码:

__kernel void Histogram(
    __global const int* input, 
    __global int* histogram, 
    int numElements) {
    // get index into global data array
    int iGID = get_global_id(0);

    // bound check, equivalent to the limit on a 'for' loop
    if (iGID >= numElements) {
        return;
    }

    if( iGID < 100 ) {
                // initialize histogram
        histogram[iGID] = 0;
    }

    barrier(CLK_GLOBAL_MEM_FENCE);

    int bin = input[iGID];

    atomic_inc(&histogram[bin]);
}

但输出直方图在每个bin中都为零。这是为什么?更进一步,如果在最后一行放置printf(“”),真正奇怪的事情就会发生。突然间,它有效。我完全迷失了,有人知道为什么会这样吗?

P.S。 我启用了所有扩展程序

1 个答案:

答案 0 :(得分:2)

我自己解决了问题。

在没有解决问题之后,我试图将CLDevice更改为CPU。一切都按原样进行(不幸的是很慢:D)。但这让我觉得它可能不是代码问题,而是OpenCL基础设施问题。

我更新了AMD的OpenCL平台,现在一切正常

谢谢你,以防你想到我的问题。