标签: queue opencl hpc
我有很多工作要执行。每个作业都包含缓冲区写入,内核执行和缓冲区读取,这些操作当然必须按顺序执行。然而,各种工作是独立的,因此可以同时执行。
使用多个有序命令队列(如使用CUDA流)和单个无序命令队列之间是否有任何性能差异,具有相同的同步?哪个更好?
答案 0 :(得分:0)
某些实现不支持无序命令队列。
根据您的说明,我会使用多个无序队列。使用单个无序队列需要在虚拟队列中同步事件,这对您来说是额外的工作。