标签: synchronization cuda gpu
有没有办法将数据传递给正在运行的CUDA内核?我认为可以通过异步启动内核并使用映射的固定内存来完成。通过这种方法,我可以写入GPU设备内存,内核代码可以从那里读取。
这种方法存在一个主要的同步问题:各个线程如何在特定的内存位置同步?