Tensorflow神经网络在CPU上比GPU更快

时间:2018-01-09 20:39:44

标签: performance tensorflow neural-network gpu

我创建了一个带有 2 隐藏图层的神经网络分类器隐藏图层单位[50,25]

该模型在 CPU 上的训练速度比 GPU 快得多。

我的问题是:

  1. 这是预期的吗?我确实看到体系结构很小但在CPU上速度不是很小:/
  2. 我该如何调试?

  3. 我尝试增加批量大小,期望在一些batch_size GPU超过CPU之后。但我没有看到这种情况发生。

  4. 我的代码位于 Tensorflow 1.4。

1 个答案:

答案 0 :(得分:0)

考虑到网络的规模(非常小),我倾向于认为这是一个DMA问题:将数据从CPU复制到GPU是昂贵的,可能足够昂贵,以至于它弥补了GPU的速度更快做更大的矩阵乘法。