我正在寻找能够帮助我创建数据流时间表以培训和评估CNN模型的工具。
我想知道每个硬件组件需要多长时间才能完成工作,希望找到瓶颈。例如,需要多长时间:
- 进行CPU预处理(例如加载和批处理数据)
- 将数据沿PCIe传递给GPU
- 使用批次获取渐变下降
- 将数据沿PCIe传回CPU
- 平均来自多个GPU(如果相关)的梯度下降结果
- 在CPU上执行剩余处理
我正在对CIFAR10 CNN from the Tensorflow tutorial进行此项研究,目的是将调查结果移植到更复杂的CNN上。我正在与之合作:
- GPU:2x NVIDIA GTX 1080 Ti
- CPU:Intel i7-6850K
- RAM:64GB
- 操作系统:Ubuntu 16.04