标签: caching cuda atomic volatile
CUDA Documentation说,
原子函数不作为内存栅栏,也不暗示内存操作的同步或排序约束(有关内存栅栏的详细信息,请参阅内存栅栏函数)
这是否意味着可以缓存原子指令的操作数? 如果是这样,有人如何确保所有线程都知道线程中非易失性全局变量的修改?