标签: cuda gpu
我希望能够使用PTX 1.3中尚未实现C接口的功能。有没有办法在PTX中编写自己的函数并注入现有的二进制文件?
我正在寻找的功能是获得%smid
%smid
答案 0 :(得分:6)
答案:
__noinline__ __device__ uint get_smid(void) { uint ret; asm("mov.u32 %0, %smid;" : "=r"(ret) ); return ret; }