performance - GPU RTX 2080 Ti tensorflow 运行速度比 CPU tensorflow 慢？

我正在使用 python 和 tensorflow 来训练机器学习模型（特别是 CNN），使用我自己定义的超重损失函数（最初有 4 个嵌套循环并且计算复杂）。为了让它更快，我使用 tf.map_fn 来向量化所有导致巨大 RAM 利用率的嵌套循环，但是，我已经确认它使损失函数更快。该模型是一个相当大的 CNN 模型，有大约 200 万个参数，我用 10000 个样本进行训练，批次大小为 128。我的主要问题是，当我仅使用 CPU (2.1GHz) 运行代码时，它的运行速度至少比在 GPU 上运行的相同代码快 100 倍（GeForce RTX 2080 Ti 计算能力：7.5）。现在的问题是我需要运行大量 epoch 的训练代码，而且需要很长时间（CPU 7 天，甚至比 GPU 还要长）。我原以为使用 GPU 时速度会有所提升，但这里似乎确实存在问题。

有关基础设施设置的详细信息： 1- GeForce RTX 2080 Ti 计算能力：7.5 coreClock：1.545GHz coreCount：68 deviceMemorySize：10.76GiB deviceMemoryBandwidth：573.69GiB/s 2-张量流-GPU 2.4.1 3- cudatoolkit 10.1.243 4-cudnn 7.6.5 5-蟒蛇3.9.5

如果你们能帮助我理解为什么会这样以及我如何解决它，我将不胜感激。

GPU RTX 2080 Ti tensorflow 运行速度比 CPU tensorflow 慢？

0 个答案: