我正在尝试在我的OpenCL内核中使用本地内存。
以下列表是相关信息。
设备信息
GPU: Qualcomm Adreno 420
local memory size: 32768Bytes = 32KB
max work group size: 1024
内核信息A(没有本地内存使用)
CL_KERNEL_WORK_GROUP_SIZE=1024
CL_KERNEL_LOCAL_MEM_SIZE=0 Bytes
内核信息B(使用本地内存)
CL_KERNEL_WORK_GROUP_SIZE=224
CL_KERNEL_LOCAL_MEM_SIZE=2048 Bytes
内核A和B之间的区别仅在于使用本地内存。 是什么造成这种情况?
如果这是寄存器问题,那么内核A的CL_KERNEL_WORK_GROUP_SIZE
应该低于1024。
我真的想检查注册用法,但我不能。
我相信我有足够的本地记忆,全球记忆。
请帮忙。