标签: arrayfire
谁能告诉我gfor结构如何分配CUDA线程?我们知道,在Arrayfire中,我们可以使用gfor进行并行计算。但是,CUDA的线程是有限的,所以我想知道,如何改进我的Arrayfire代码,我应该根据GPU硬件架构重新设计gfor结构。