atomicAdd()for GPU上的double

时间:2013-04-18 07:57:31

标签: cuda atomic

我在GPU上做一个项目,我必须使用atomicAdd()作为double,因为cuda不支持double,所以我使用下面的代码,这是NVIDIA提供的。

__device__ double atomicAdd(double* address, double val)
{
    unsigned long long int* address_as_ull =
                                          (unsigned long long int*)address;
    unsigned long long int old = *address_as_ull, assumed;
    do {
        assumed = old;
        old = atomicCAS(address_as_ull, assumed, 
                        __double_as_longlong(val + 
                        __longlong_as_double(assumed)));
    } while (assumed != old);
    return __longlong_as_double(old);
}

现在我想知道为什么工具需要一个循环,而(假设!=旧)

1 个答案:

答案 0 :(得分:9)

基本上因为实现需要加载,而不能以原子方式执行。比较和交换操作是

的原子版本
(*address == assumed) ? (assumed + val) : *address

无法保证address的值在address加载值的周期与atomicCAS调用用于存储的周期之间不会发生变化更新的价值。如果发生这种情况,address的值将不会更新。因此,循环确保重复这两个操作,直到读取和比较和交换操作之间的address值没有变化,这意味着更新发生。