在CUDA模式下使用割炬Autograd Profiler解释CPU和GPU时间

时间:2019-05-09 21:37:52

标签: profiling pytorch torch autograd

我正在尝试使用torch.autograd.profiler来分析网络,并且需要一些有关报告的CPU和GPU时间的解释。我假设时间几乎相等,因为CPU时间包括内核启动+执行的时间。但是,当尝试查找CPU和GPU时间之间的关系时,我发现不一致。

如下所示,一些操作报告的时间大约相同,一些操作报告的CPU时间大于GPU时间,而某些操作的CPU时间小于GPU时间。有人可以解释一下时间的差异。

  1. OpName CPUTime GPUTime
  2. relu 14.700us 15.936us
  3. sub 112.447us 93.504us
  4. 毫米43.501us 46.912us
  5. CatBackward 84.912us 84.704us

谢谢

0 个答案:

没有答案