我有一个函数float atomic_add:
inline void AtomicAdd(volatile __global float *source, const float operand)
{
union{unsigned int intVal; float floatVal;} newVal;
union{unsigned int intVal; float floatVal;} oldVal;
do {
oldVal.floatVal = *source;
newVal.floatVal = oldVal.floatVal + operand;;
}
while (atomic_cmpxchg((volatile __global unsigned int *)source, oldVal.intVal, newVal.intVal) != oldVal.intVal);
}
这是主内核,它调用上面的函数:
__kernel void main_kernel(__global float* image)
{
AtomicAdd(&image[0], 1.0f);
}
以上功能正常运行。现在我想引入一个局部变量来强制一次性完成一个工作组中的AtomicAdd:
__kernel void main_kernel(__global float* image)
{
__local tmpSum[1];
if(get_local_id(0)==0) {
tmpSum[0] = 0.0f; }
barrier(CLK_LOCAL_MEM_FENCE);
AtomicAdd(&tmpSum[0], 1.0f);
barrier(CLK_LOCAL_MEM_FENCE);
AtomicAdd(&image[0], tmpSum[0]);
}
日志发出以下错误:
Build log:
:422:15: error: illegal implicit conversion between two pointers with different address spaces
AtomicAdd(&tmpSum[0], 1.0f);
^~~~~~~~~~
:422:15: warning: passing 'float __attribute__((address_space(3))) *' to parameter of type 'float volatile __attribute__((address_space(1))) *' discards qualifiers
AtomicAdd(&tmpSum[0], 1.0f);
^~~~~~~~~~
:17:49: note: passing argument to parameter 'source' here
inline void AtomicAdd(volatile __global float *source, const float operand)
正如您所看到的,全局和本地指针之间的不同地址空间似乎有问题。有没有人知道这里发生了什么?
答案 0 :(得分:0)
无法将__local
指针传递给采用__global
指针的函数,反之亦然。需要使用__local
指针获取AtomicAdd函数的副本才能成功构建内核。
答案 1 :(得分:0)
我把解决方案放在这里。正如doqtor所指出的,__ local与_global有不同的地址空间。所以最简单的方法是重载,遗憾的是opencl不支持。我必须定义一个新的内联函数并解决问题。