学习了如何为使用TensorFlow构建的模型分配GPU内存后,我了解到我可以做到:
分配总内存的一部分,或者
使用allow_growth
分配模型所需的内存。
但是,似乎使用allow_growth
并没有分配模型成功运行所需的最小内存。
例如,我已经实现了PVANet-Lite的修改版本(〜1.2 M参数)作为检测任务的主干。当我使用allow_growth
时,程序占用了~4500MB
的内存;但是当内存限制设置为800MB
时,程序仍可以以相似的检测速率(fps)成功运行。
所以,我的问题是: