TensorFlow中每第N次迭代检查点(即保存快照)模型的最佳做法是什么?
显然,可以使用自定义逻辑来调用tf.train.Saver.save
,但是想知道是否有内部机制呢?
答案 0 :(得分:0)
我根据我希望保存检查点的频率来做这样的事情:
if (epoch % N) == (N - 1):
saveto=CkptDir+"ckpt/model"+str(N)+".ckpt"
save_path = saverRun.save(session, saveto)
这将保存一个检查点文件N epoch's。
答案 1 :(得分:0)
找到解决方案here。可以设置max_to_keep
和keep_checkpoint_every_n_hours
以获得所需的保存。