Caffe批处理没有加速

时间:2017-01-27 09:14:42

标签: c++ deep-learning benchmarking caffe

我想用caffe加速CNN分类的正向传递。

我已尝试使用此处提供的代码在Caffe中进行批量分类: Modifying the Caffe C++ prediction code for multiple inputs 这个解决方案使我能够给出Mat的向量,但它不会加快任何速度。即使输入层已被修改。

我正在使用两台GTX1080在强大的电脑上处理非常小的图像(3x64x64),并且在内存方面没有问题。 我也尝试过更改deploy.prototxt,但我得到了相同的结果。

似乎CNN的前向传球在某一时刻变为顺序。 我看到有人在这里指出这个: Batch processing mode in Caffe - no performance gains

另一个类似的线程,用于python:batch size does not work for caffe with deploy.prototxt

我见过MemoryDataLayer的一些内容,但我不确定这会解决我的问题。

所以我对于该做什么感到很遗憾......有没有人知道如何加快分类时间。 谢谢你的帮助!

0 个答案:

没有答案