我试图在CUDA文件中标记代码区域,然后在GPGPU-Sim(一种流行的CUDA代码模拟器)中进行模拟。我想向CUDA添加一个伪指令,然后在模拟器中捕获它。我之前在X86指令集中已经完成了,但是这里的工作方式不同。我在X86中完成此操作的方法是在.C文件中添加内联汇编代码,如下所示:
__asm__ __volatile__ (".byte 0x60;\n")
这将引入一个"坏"汇编代码中的指令。我试图添加这样一个"坏"对CUDA文件的指令。有什么建议吗?