标签: windows caffe
我在Windows 10上运行了一个运行Caffe的nVidia Pascal GPU。当我在Visual Studio上运行NSight时,测试模式下的前向传播只显示了4.3%的GPU利用率,而使用16内核只有不到1%调用
我正在研究一个实时系统,所以我试图尽可能快地推进传播工作。
如果我增加内核大小,我将不得不重新运行我的培训,这是一个非常昂贵的过程,时间紧迫。
我可以对Caffe或CUDA进行哪些其他调整以提高测试速度?