应用错误收集

我正在使用TensorFlow中的here运行AlexNet模型，用于评估库在GPU上花费的时间，以及以下参数和硬件：

我说GPU上的实际执行时间只是培训执行时间的一小部分（下图比较了TensorFlow和AlexNet与Caffe及其AlexNet的实现）

（用nvidia-smi捕获的信息。'Porcentagem'表示百分比，'Tempo（s）'表示时间（秒））

GPU利用率在训练中频繁地在0到100％之间振荡。为什么？ Caffe的振荡率不超过40％

此外，Tensorflow花了很多时间从主机到设备进行内存复制，而Caffe没有。但为什么？（tensorflow）

（CAFFE）