每个线程的CUDA最大寄存器:sm_12 vs sm_20

时间:2011-05-19 11:58:12

标签: optimization cuda cpu-registers

我的内核广泛使用寄存器。

编译1.2设备时--ptxas-options=-v报告83个寄存器。当我尝试编译2.0时,只有63个寄存器在使用,其余的本地数据被放入本地存储器。使用'--maxrregcount'进行的实验为1.2个设备提供了每个线程124个寄存器的限制,为2.0提供了63个寄存器。

是否可以将所有数据放入2.0架构的寄存器中?

1 个答案:

答案 0 :(得分:2)

不幸的是,计算能力2.x卡的每线程寄存器限制是每个线程63个寄存器。如果你有一个非常复杂的内核消耗大量寄存器,那么无论如何都不能阻止本地内存溢出。