我尝试使用OpenCL编写一个示例直方图工具。首先,我只是强调以原子方式递增每个bin。我提出了以下内核代码:
__kernel void Histogram(
__global const int* input,
__global int* histogram,
int numElements) {
// get index into global data array
int iGID = get_global_id(0);
// bound check, equivalent to the limit on a 'for' loop
if (iGID >= numElements) {
return;
}
if( iGID < 100 ) {
// initialize histogram
histogram[iGID] = 0;
}
barrier(CLK_GLOBAL_MEM_FENCE);
int bin = input[iGID];
atomic_inc(&histogram[bin]);
}
但输出直方图在每个bin中都为零。这是为什么?更进一步,如果在最后一行放置printf(“”),真正奇怪的事情就会发生。突然间,它有效。我完全迷失了,有人知道为什么会这样吗?
P.S。 我启用了所有扩展程序
答案 0 :(得分:2)
我自己解决了问题。
在没有解决问题之后,我试图将CLDevice更改为CPU。一切都按原样进行(不幸的是很慢:D)。但这让我觉得它可能不是代码问题,而是OpenCL基础设施问题。
我更新了AMD的OpenCL平台,现在一切正常。
谢谢你,以防你想到我的问题。