我在Cloud ML Engine上使用tensorflow对象检测API来训练模型。我想知道的是,有没有办法在train
文件夹中保存更多模型检查点?
现在,模型保存了五个最新的检查点。
答案 0 :(得分:2)
RunConfig
对象接受参数keep_checkpoint_max
,默认为5.在model_main.py
中,您可以看到正在实例化的RunConfig
对象(link):< / p>
config = tf.estimator.RunConfig(model_dir=FLAGS.model_dir)
您需要将该文件更新为:
config = tf.estimator.RunConfig(model_dir=FLAGS.model_dir, keep_checkpoint_max=5)
或者,相当于,创建一个可以通过的新标志。
答案 1 :(得分:2)
您可以在配置文件中将keep_checkpoint_max
添加到train_config。默认值为5.