标签: performance neural-network deep-learning conv-neural-network convolution
我正在尝试在基于gemm的卷积中实现im2col。而且im2col占用了大约32%的时间。 与整体卷积相比,我没有找到多少时间的参考。
我正在使用基于https://github.com/BVLC/caffe/blob/master/src/caffe/util/im2col.cpp的实现 我刚刚阻止了output_x和output_y尺寸。
我也在使用MKL的宝石。
一般来说,它的时间比例是多少,难道我的比例不是太高吗?