标签: gpu opencl llvm amd-rocm
我稍微修改了llvm(roc-1.6.x)以生成可以在AMDGPU pro驱动上运行的代码。对于相同的opencl代码,它可以运行,但性能比AMDGPU的在线编译器慢10%以上。我想知道是否可以设置一些标志来调整llvm。如果您能给我一些例子,那就太好了。