据我了解,PTX的主要优点是可以访问几个特定的指令。它也是中级编程语言。这意味着,nvidia编译器不执行直接PTX代码。它将PTX代码重新编译为硬件特定的程序集。
当我们考虑这些所有术语时,简而言之,我想知道PTX指令调度是否有任何影响?另外,如果我们重新安排PTX代码,我们可以获得性能还是可以看到任何影响?
提前致谢
答案 0 :(得分:3)
指令调度的最终仲裁者是CUDA驱动程序,它包含一个优化编译器,可将PTX转换为GPU的微码。如果指令调度是您预期使用PTX的唯一好处,那么您的投资回报率不会很高。通过混淆编译器在CUDA驱动程序中使用的启发式方法,它甚至可能适得其反。