令人困惑的TensorFlow执行时间细分(TensorFlow时间轴)

时间:2019-01-28 22:16:58

标签: tensorflow profiling

我正在尝试对TensorFlow functions进行配置,以进行培训CIFAR-10 dataset。我修改了TensorFlow提供的内置cifar-10 example,以创建timeline.json文件。

这是网络体系结构: conv-pool-norm-conv-norm-pool-fc-fc

几个时期之后,我停止了训练,以查看执行时间配置文件。时序细分按降序排列:

    1. LRNGrad -4.931毫秒
    1. LRN-1.513毫秒
    1. Conv2DBackpropFilter-1.198毫秒
    1. Con2DBackpropInput-1.054毫秒
    1. MaxPoolGrad-0.931毫秒
    1. Conv2D-0.742毫秒
    1. MatMul-0.406

..等等。

我希望Conv2DConv2DBackpropFilterConv2DBackpropInput是主要的贡献因素,但不确定LRNGradLRN为何占据如此大的份额时间。

有人可以指出我的分析方法是否做错了,还是其他原因?

谢谢。

0 个答案:

没有答案