GPU RTX 2080 Ti tensorflow 运行速度比 CPU tensorflow 慢?

时间:2021-07-21 03:17:22

标签: performance tensorflow keras gpu tensorflow2.0

我正在使用 python 和 tensorflow 来训练机器学习模型(特别是 CNN),使用我自己定义的超重损失函数(最初有 4 个嵌套循环并且计算复杂)。为了让它更快,我使用 tf.map_fn 来向量化所有导致巨大 RAM 利用率的嵌套循环,但是,我已经确认它使损失函数更快。 该模型是一个相当大的 CNN 模型,有大约 200 万个参数,我用 10000 个样本进行训练,批次大小为 128。 我的主要问题是,当我仅使用 CPU (2.1GHz) 运行代码时,它的运行速度至少比在 GPU 上运行的相同代码快 100 倍(GeForce RTX 2080 Ti 计算能力:7.5)。 现在的问题是我需要运行大量 epoch 的训练代码,而且需要很长时间(CPU 7 天,甚至比 GPU 还要长)。 我原以为使用 GPU 时速度会有所提升,但这里似乎确实存在问题。

有关基础设施设置的详细信息: 1- GeForce RTX 2080 Ti 计算能力:7.5 coreClock:1.545GHz coreCount:68 deviceMemorySize:10.76GiB deviceMemoryBandwidth:573.69GiB/s 2-张量流-GPU 2.4.1 3- cudatoolkit 10.1.243 4-cudnn 7.6.5 5-蟒蛇3.9.5

如果你们能帮助我理解为什么会这样以及我如何解决它,我将不胜感激。

0 个答案:

没有答案