在基于并行gemm的卷积中im2col的时间比例是多少

时间:2019-08-19 16:01:43

标签: performance neural-network deep-learning conv-neural-network convolution

我正在尝试在基于gemm的卷积中实现im2col。而且im2col占用了大约32%的时间。 与整体卷积相比,我没有找到多少时间的参考。

我正在使用基于https://github.com/BVLC/caffe/blob/master/src/caffe/util/im2col.cpp的实现 我刚刚阻止了output_x和output_y尺寸。

我也在使用MKL的宝石。

一般来说,它的时间比例是多少,难道我的比例不是太高吗?

0 个答案:

没有答案