基本上,我正在测试Conv2D和QuantizedConv2D的差异速度。我发现如果我使用两个常量节点作为输入和滤波器,则QuantizedConv2D比Conv2D快; 但如果我使用占位符节点作为输入,并使用常量节点作为过滤器,则QuantizedConv2D比Conv2D慢得多。
我使用“tf.Session.run”方法将数据提供给占位符。
我的环境是:
tensorflow-1.3(仅限CPU), 用源代码编译,python2.7; (编译tensorflow时,我使用-msse4.1)
我使用python time模块来测试成本时间
a=time.time();
for i in range(NUM):
c=sess.run([output], feed_dict={data: np_list});
b=time.time();
costime = (b-a)/NUM;
有人可以分享原因吗?