为什么谷歌云上的vGPU(特斯拉K80)​​比T460P上的GTX940M慢

时间:2017-07-06 03:29:56

标签: google-app-engine google-cloud-platform gpu ubuntu-16.04

我对Google云虚拟机上的vGPU(Tesla K80)有疑问。

我的笔记本电脑是Lenovo T460P配备以下规格:

  • CPU:intel i7-6700HQ
  • RAM:16GB
  • GPU:nVIDIA GTX 940M(CUDA核心:348)
  • 操作系统:Windiws 10 Pro 64bit
  • OpenCV:ver3.2.0,支持CUDA 8.0(我从http://jamesbowley.co.uk/downloads/下载)

我在Google Cloud中创建的VM包含以下规范:

  • CPU:vCPU x 2
  • RAM:4GB
  • HDD:25GB
  • GPU:vGPU(特斯拉K80)​​x 1(CUDA核心4992)
  • OS:Ubuntu 16.04 LTS 64bit
  • CUDA驱动程序:我按照以下链接的安装程序进行操作:https://cloud.google.com/compute/docs/gpus/add-gpus
  • OpenCV:ver 3.2.0(编译参数:
    • cmake -D CMAKE_BUILD_TYPE = RELEASE -D CMAKE_INSTALL_PREFIX = / usr / local -D WITH_CUDA = ON -D WITH_CUBLAS = ON -D WITH_TBB = ON -D CUDA_GENERATION = Auto -D ENABLE_FAST_MATH = 1 -D CUDA_FAST_MATH = 1 -D WITH_NVCUVID = 1 -D WITH_CUFFT = ON -D WITH_EIGEN = ON -D WITH_IPP = ON)

我使用opencv训练LBP级联,160张正面图像和800张负面图像。 我在上述两种环境中使用相同的正负样本 以下是opencv_createsamples和opencv_traincascade的参数:

  

opencv_createsamples -info data / positive_images / positives.txt -vec data / positive_images / positives.vec -w 32 -h 32

     

opencv_traincascade -data classifier -vec data / positive_images / positives.vec -bg data / negative_images / negatives.txt -mode BASIC -featureType LBP -numPos 160 -numNeg 800 -minHitRate 0.998 -maxFalseAlarmRate 0.05 -w 32 -h 32 - numStages 10

然而,我发现我的笔记本电脑需要5分钟才能完成培训。而且谷歌云的时间超过了20分钟,仍处于培训阶段。

opencv_traincascade on Google cloud vm with Tesla K80

nvidia-smi on Google cloud vm

谷歌虚拟机的问题是什么? 我认为谷歌的虚拟机应该比我的笔记本电脑计算得更快,因为虚拟机有特斯拉K80。但它实际上比我的笔记本电脑慢得多。

在Google云端虚拟机上我是否遗漏了某些内容或做错了什么?

感谢您的帮助。

0 个答案:

没有答案