应用错误收集

在基于并行gemm的卷积中im2col的时间比例是多少

时间：2019-08-19 16:01:43

标签： performance neural-network deep-learning conv-neural-network convolution

我正在尝试在基于gemm的卷积中实现im2col。而且im2col占用了大约32％的时间。与整体卷积相比，我没有找到多少时间的参考。

我正在使用基于https://github.com/BVLC/caffe/blob/master/src/caffe/util/im2col.cpp的实现我刚刚阻止了output_x和output_y尺寸。

我也在使用MKL的宝石。

一般来说，它的时间比例是多少，难道我的比例不是太高吗？

0 个答案:

没有答案