标签: clang gpu opencl llvm amd
我正在使用llvm clang脱机将我的opencl代码编译为程序集。我的目标是amdgpu--amdhsa。由clang生成的汇编文件的配置为“ enable_sgpr_dispatch_ptr = 1”。我可以做些什么在生成的程序集文件中将其关闭吗?同样,内核参数的顺序似乎与AMDCL2约定的顺序相反。也就是说,用户参数放在首位,而隐藏参数(例如“ HiddenGlobalOffsetX”)则放在用户参数后。我可以更改参数的顺序,以便第一个参数是用户参数之前的隐藏参数吗?