在numba cuda内核中,我知道我们可以定义本地和共享数组。同样,内核中的所有变量分配都进入特定线程的寄存器。是否可以使用numba cuda声明寄存器数组?类似于CUDA C内核中将使用的以下内容?
register float accumulators[32];
答案 0 :(得分:1)
不可能。
register
关键字仅是编译器的提示,它在CUDA C / C ++中基本上没有作用。设备代码编译器将根据其试探法来决定要放入寄存器的内容,以生成快速代码,而不是程序员的指令。