标签: opencl intel
Intel Optimization guide说:
细粒度分区 - 分割成较小的部分 来自剩余工作池的设备请求。这个 分区方法模拟“共享队列”。更快的设备 请求新输入更快,从而实现自动负载平衡。该 粒度必须足够大才能分摊相关的间接费用 来自额外的日程安排和内核提交。
我无法理解它是如何模拟共享队列的?请帮我理解这个。