我正在寻找使用ptx-verbose选项编译的CUDA内核以下输出:
ptxas info:为'sm_61'编译入口函数'_Z19IntersectRaysKernelPdS_S_PcPiS1_yyyyS_' ptxas info:_Z19IntersectRaysKernelPdS_S_PcPiS1_yyyyS_的函数属性 48字节堆栈帧,0字节溢出存储,0字节溢出加载
ptxas info:使用112个寄存器,64字节累积堆栈大小,408字节cmem [0],40字节cmem [2]
由于内存消耗,我可以推断出最大内核启动参数(即grid_dim和blk_dim)吗? (我正在使用GF GTX 1050 Ti)