我的内核广泛使用寄存器。
编译1.2设备时--ptxas-options=-v
报告83个寄存器。当我尝试编译2.0时,只有63个寄存器在使用,其余的本地数据被放入本地存储器。使用'--maxrregcount'进行的实验为1.2个设备提供了每个线程124个寄存器的限制,为2.0提供了63个寄存器。
是否可以将所有数据放入2.0架构的寄存器中?
答案 0 :(得分:2)
不幸的是,计算能力2.x卡的每线程寄存器限制是每个线程63个寄存器。如果你有一个非常复杂的内核消耗大量寄存器,那么无论如何都不能阻止本地内存溢出。