标签: tensorflow caffe memcpy
我正在使用TensorFlow中的here运行AlexNet模型,用于评估库在GPU上花费的时间,以及以下参数和硬件:
我说GPU上的实际执行时间只是培训执行时间的一小部分(下图比较了TensorFlow和AlexNet与Caffe及其AlexNet的实现)
(用nvidia-smi捕获的信息。'Porcentagem'表示百分比,'Tempo(s)'表示时间(秒))
GPU利用率在训练中频繁地在0到100%之间振荡。为什么? Caffe的振荡率不超过40%
此外,Tensorflow花了很多时间从主机到设备进行内存复制,而Caffe没有。但为什么? (tensorflow)
(CAFFE)