PTX代码性能

时间:2016-03-29 20:43:49

标签: cuda gpgpu ptx

我知道CUDA(不错),但我不知道PTX,所以我的问题是:

  • 学习ptx代码有助于提高gpu(CUDA)的性能 码?
  • 如果是,是否有办法编写可与之结合使用的ptx代码 CUDA代码可以提高性能吗?

1 个答案:

答案 0 :(得分:4)

根据我的个人经验,PTX有助于调试/检查一个非平凡的问题。但是,我只做了一次。另外,请记住,PTX只是编译器生成的直接代码,不是在GPU上执行的实际汇编语言。

如果您真的想查看在PTX之后组装的机器代码,NVIDA会提供cuobjdump。我认为PTX有很多有用的信息和良好的文档,所以学习它会有所帮助。但是,CUDA的一般优化策略包括:

  • 最大限度地减少内存事务,尤其是设备/主机之间的数据传输
  • 合并全局内存访问
  • 通过内核配置提高设备利用率
  • 避免扭曲发散

对于您的第二个问题,是的,您可以通过inline PTX在CUDA中编写PTX。我从来没有这样做过。