Nvidia Visual Profiler建议我尝试使用maxregcount标志进行编译。在Alea GPU中有什么相同的东西,它是如何使用的?
我正在使用JIT编译,并且找到了JITMaxRegisters选项,但它似乎对每个线程的寄存器数没有影响。
{ worker.DefaultCompileOptions.ToProfilingConfig ()
with JITMaxRegisters = Some 60;
MinimalArch = DeviceArch.Create("sm35")}
使用此编译选项,可视化分析器仍然表示正在使用72个寄存器/线程。
我缺少任何与maxregcount或__launch_bounds__等效的内容吗?