为什么TensorFlow在Titan X上用HtoD memcpy花了这么多时间?

时间:2017-12-06 23:55:36

标签: tensorflow caffe memcpy

我正在使用TensorFlow中的here运行AlexNet模型,用于评估库在GPU上花费的时间,以及以下参数和硬件:

  • 火车数据集上的1024张图片
  • 10个时期,小批量大小为128
  • 使用GPU GTX Titan X

我说GPU上的实际执行时间只是培训执行时间的一小部分(下图比较了TensorFlow和AlexNet与Caffe及其AlexNet的实现)

enter image description here (用nvidia-smi捕获的信息。'Porcentagem'表示百分比,'Tempo(s)'表示时间(秒))

GPU利用率在训练中频繁地在0到100%之间振荡。为什么? Caffe的振荡率不超过40%

此外,Tensorflow花了很多时间从主机到设备进行内存复制,而Caffe没有。但为什么? enter image description here (tensorflow)

enter image description here (CAFFE)

0 个答案:

没有答案