我在Linux Mint 18上安装了tensorflow-gpu。我的显卡是GT 740m。 CUDA的deviceQuery
和bandwidthTest
以及cudnn脚本的MNISTsample传递(引用here和here)。
Tensorflow确实使用GPU(例如,跟随these指令有效,并且在运行程序时GPU的内存和处理利用率会增加),但性能相当......平庸。
例如,运行this site上显示的脚本,GPU的速度只有CPU的两倍。当然,这是一个很好的改进,但不是真的,非常快,并且正如网站上所说的那样。另一个例子:使用带有Keras的vgg16对100个图像进行分类,每个大约300x200像素大约需要30秒。
我可以做些什么来提高性能,还是我不能期待更好的东西?
搜索查询:慢,