如何调整ROCm(llvm)编译器的性能?

时间:2018-09-05 18:23:50

标签: gpu opencl llvm amd-rocm

我稍微修改了llvm(roc-1.6.x)以生成可以在AMDGPU pro驱动上运行的代码。对于相同的opencl代码,它可以运行,但性能比AMDGPU的在线编译器慢10%以上。我想知道是否可以设置一些标志来调整llvm。如果您能给我一些例子,那就太好了。

0 个答案:

没有答案