大批量训练时的OOM

时间:2019-08-03 11:04:59

标签: tensorflow tensorflow-estimator

我正在使用2个gpus来训练448个大批量的nn。在psensor应用程序中,我看到每个gpu使用的内存约为46%。如果我尝试增加批量大小,则会收到OOM错误(资源耗尽)。我使用的是tensorflow估计量,据我所知,它们创建2个独立的图,一个用于训练,一个用于评估。是这个原因吗?

0 个答案:

没有答案