Tensorflow训练,如何防止训练节点删除

时间:2018-11-07 18:20:10

标签: python tensorflow machine-learning

我正在使用Tensorflow和python进行对象检测。

我想开始训练并将其保留一段时间,并保留所有训练节点(model-cpk)。标准Tensorflow训练似乎删除了节点,仅保留了最后几个节点。我该如何预防?

如果这是错误的地方,请原谅。如果被告知一个适当的地方,我将不知所措。谢谢。

2 个答案:

答案 0 :(得分:1)

您可以对keep_checkpoint_max中的tf.estimator.RunConfig使用model_main.py标志。 您可以将其设置为非常大的数目以实际保存所有检查点。 但是,应警告您,根据型号的大小和保存频率的不同,它可能会填满磁盘(因此在训练过程中会崩溃)。 您可以通过save_checkpoints_steps的标志save_checkpoints_secsRunConfig更改保存频率。默认值为save_checkpoints_secs,默认值为600(10分钟)。

答案 1 :(得分:0)

您可以保存模型检查点,因为要对测试数据进行预测时,将再次加载.hdf5文件。 希望有帮助。