信息:我的Windows和Ubuntu系统是相同的。我只是使用可移动驱动器托架换了启动驱动器。
*不使用Docker
CPU:i9-7920X(128 GB DDR4)
GPU: 2土卫六与 RTX 2070(显示)
Windows 10: TCC群集中的Nvidia驱动程序416.81和 CUDA 10
Ubuntu Desktop 18.04: Nvidia驱动程序410.72(不确定是否需要在Linux上群集)和 CUDA 10
测试软件: 运行TensorFlow cifar10 esitimator-相同的训练数据-(底部链接)
python cifar10_main.py --data-dir = / tmp --job-dir = / tmp / cifar10 --num-gpus = 2 --train-steps = 10000
Windows在420秒(7.0分钟)内完成 Ubuntu在614秒(10.2分钟)内完成
https://github.com/tensorflow/models/tree/master/tutorials/image/cifar10_estimator
为什么Ubuntu这么慢?是否需要在Linux上群集GPU,还是问题出在不同的驱动程序(Ubuntu与Windows)?
谢谢。