我注意到新的Estimator API会在训练期间自动保存检查点,并在训练中断时从上一个检查点自动重启。不幸的是,它似乎只保留了最后5个检查点。
您知道如何控制培训期间保留的检查点数量吗?
答案 0 :(得分:6)
Tensorflow tf.estimator.Estimator将config
作为可选参数,可以是tf.estimator.RunConfig对象来配置运行时设置。您可以按如下方式实现此目的:
# Change maximum number checkpoints to 25
run_config = tf.estimator.RunConfig()
run_config = run_config.replace(keep_checkpoint_max=25)
# Build your estimator
estimator = tf.estimator.Estimator(model_fn,
model_dir=job_dir,
config=run_config,
params=None)
config
参数适用于扩展DNNClassifier
的所有类(DNNLinearCombinedClassifier
,LinearClassifier
,estimator.Estimator
等)。