应用错误收集

如何使用Tensorflow在单个GPU上训练具有相对较大批量的大型模型？

时间：2018-01-19 12:50:38

标签： tensorflow deep-learning

我有一个非常大的模型，由于内存不足错误，无法在批量大小为64的单个GPU上进行训练。有人建议我使用较小的批量。但是，如果我减小批量，则精度会下降。其中一个解决方案是只喂一半当前批次，存储梯度然后喂入剩余的。这可以使用compute_gradients和apply_gradients明确完成。但它相对不方便（如果存在简洁的实现则可以）。所以我想知道这个问题是否有更好的解决方案（或简洁的实现）。

提前致谢。

1 个答案:

答案 0 :(得分：3)

您可以考虑调查一下：https://github.com/openai/gradient-checkpointing。

最近有很多关于以更多的前向传递为代价使反向提高内存效率的研究。这是TensorFlow的一个这样的方案的最近实现。

使用GPU训练模型
在张量流中训练大模型时如何解决GPU内存不足的问题？
Tensorflow：如何使用GPU训练LSTM
tensorflow使用gpus训练模型，并使用java api进行推理
是否可以在一个GPU上一起训练pytorch和tensorflow模型？
如何使用Tensorflow在单个GPU上训练具有相对较大批量的大型模型？
如何使用TensorflowSharp训练模型
使用TensorFlow训练图像时使用GPU错误
如何为移动GPU训练模型？
是否可以在GPU上训练模型，然后在CPU上进行预测

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？