标签: profiling pytorch torch autograd
我正在尝试使用torch.autograd.profiler来分析网络,并且需要一些有关报告的CPU和GPU时间的解释。我假设时间几乎相等,因为CPU时间包括内核启动+执行的时间。但是,当尝试查找CPU和GPU时间之间的关系时,我发现不一致。
如下所示,一些操作报告的时间大约相同,一些操作报告的CPU时间大于GPU时间,而某些操作的CPU时间小于GPU时间。有人可以解释一下时间的差异。
谢谢