CUDA中的杂项和线程间通信指令

时间:2014-09-04 16:42:29

标签: cuda nvidia profiler instructions

我一直在玩NVIDIA分析器(nvprof),有两个我不理解的特定指标:

inst_inter_thread_communication
    Number of inter-thread communication instructions executed by non-predicated threads
inst_misc
    Number of miscellaneous instructions executed by non-predicated threads

我只是想知道哪些指令是线程间通信指令以及哪些指令属于杂项。

参考: http://docs.nvidia.com/cuda/profiler-users-guide/#metrics-reference

1 个答案:

答案 0 :(得分:6)

属于两类的SASS说明如下:

<强> inst_inter_thread_communication

  • SHFL
  • VOTE

<强> inst_misc

  • NOP
  • S2R,B2R,R2B,P2R
  • LEPC
  • CSET [P],PSET [P]
  • MOV
  • SEL
  • PRMT
  • Maxwell Only(BAR,DEPBAR)
  • 有几个不常见的未记录的说明会增加此类别。

文档 CUDA二进制实用程序部分Instruction Set Reference包含SASS指令的简要说明。 SASS和PTX之间的关系接近1:1,因此您还可以查看PTX ISA手册。