屏障(CLK_LOCAL_MEM_FENCE)在还原时内核的本地数组中出现奇怪的死锁

时间:2017-12-20 02:20:18

标签: opencl intel barrier spir

代码由clCreateProgramWithSource运行良好, BUT 由clCreateProgramWithBinary运行。 工作组的大小是(8,8),我重现了英特尔图形win8.1 + HD4600 / 530和win10 + HD630的死锁。

a = SumAlpha[index];
b = SumAlpha[index + i];
SumAlpha[index] = a+ b;

创建spir的cmd是

{{1}}

我尝试了' -cl-opt-disable',同样的死锁。 我试过下面的等价,也是死锁。

{{1}}

我可以使用指令点来避免减少,而我想知道更多。 我错过了什么?或者有没有办法将两种方式的发电机组倾销出来以比较它们的差异?非常感谢。

0 个答案:

没有答案