使用Tensorflow进行基准测试和发现瓶颈

时间:2017-12-24 10:45:48

标签: ubuntu tensorflow benchmarking intel nvidia

我正在寻找能够帮助我创建数据流时间表以培训和评估CNN模型的工具。

我想知道每个硬件组件需要多长时间才能完成工作,希望找到瓶颈。例如,需要多长时间:

  • 进行CPU预处理(例如加载和批处理数据)
  • 将数据沿PCIe传递给GPU
  • 使用批次获取渐变下降
  • 将数据沿PCIe传回CPU
  • 平均来自多个GPU(如果相关)的梯度下降结果
  • 在CPU上执行剩余处理

我正在对CIFAR10 CNN from the Tensorflow tutorial进行此项研究,目的是将调查结果移植到更复杂的CNN上。我正在与之合作:

  • GPU:2x NVIDIA GTX 1080 Ti
  • CPU:Intel i7-6850K
  • RAM:64GB
  • 操作系统:Ubuntu 16.04

0 个答案:

没有答案