标签: tensorflow profiler
我在使用tensorflow profiler进行分析时发现了一些无法解释的东西。
使用事件探查器测量的时间似乎比没有事件探查器慢得多。 例如:我用Transformer模型翻译一个句子,通常需要70毫秒,而使用探查器则需要220毫秒。
代码是这个。
with tf.contrib.tfprof.ProfileContext('/home/work/tmp/profile') as pctx
分析器会占用过多的开销吗?哪一部分花费那么多时间?开销发生在每个操作中还是操作之间?