保存更多检查点Cloud ML Engine

时间:2018-05-08 11:58:55

标签: google-cloud-platform google-cloud-ml

我在Cloud ML Engine上使用tensorflow对象检测API来训练模型。我想知道的是,有没有办法在train文件夹中保存更多模型检查点? 现在,模型保存了五个最新的检查点。

2 个答案:

答案 0 :(得分:2)

RunConfig对象接受参数keep_checkpoint_max,默认为5.在model_main.py中,您可以看到正在实例化的RunConfig对象(link):< / p>

config = tf.estimator.RunConfig(model_dir=FLAGS.model_dir)

您需要将该文件更新为:

config = tf.estimator.RunConfig(model_dir=FLAGS.model_dir, keep_checkpoint_max=5)

或者,相当于,创建一个可以通过的新标志。

答案 1 :(得分:2)

您可以在配置文件中将keep_checkpoint_max添加到train_config。默认值为5.