我今天刚拿到2080 ti,并将其连接起来,可以在模型上试验Keras。但是由于某些原因,当我在密集模型上训练时,2080 ti比我的CPU(i7 4790k)慢2倍,并且绝对比我的旧GTX 1070慢(没有确切的数字可比)。 >
要在我的CPU上训练一个纪元,需要20秒,而2080 ti需要67秒,而模型或数据更改都没有。相同批次的数量为128,等等。这也比我昨晚在机器上刚购买的1070慢得多。我在训练时检查了GPU的使用情况,并且内存使用率达到了最大值,GPU的使用率达到了大约20%,而空闲状态为4%。我拥有CUDA 10,以及NVIDIA网站上的最新CuDNN:v7.6.5。 TensorFlow是1.15
有人知道这里发生了什么吗?如果需要更多详细信息,请评论我可以添加它们。
答案 0 :(得分:0)
我对1.15也有疑问。您是否偶然遇到这样的错误?(https://github.com/tensorflow/models/issues/7640):
内部:在Windows上不支持调用ptx依靠驱动程序来执行ptx编译。此消息将仅记录一次。
其他有此错误的人训练也很慢。
降级为Tensorflow 1.14已为我修复。
答案 1 :(得分:0)
我知道了!由于最近有一位朋友获得了2060的建议,他指出默认的电源模式是Nvidia控制面板中的最大省电模式,或者根据nvidia-smi
的P8功耗模式(这是时钟速度的一半)。设置为希望在3D设置中获得最佳性能后,训练时间已大大减少。