标签: cuda synchronization
我对CUDA提供的线程通信和同步机制感到有些困惑。有人可以帮我验证下面的假设吗?
warp中的线程使用共享或全局内存进行通信,并使用隐式同步进行同步
线程块内的Warp 使用共享或全局内存进行通信并使用屏障同步进行同步
给定网格或内核中的线程块使用全局内存进行通信并使用原子内存操作进行同步
来自不同网格或内核的线程块使用全局内存进行通信并使用隐式同步进行同步