我正在使用Tensorflow和python进行对象检测。
我想开始训练并将其保留一段时间,并保留所有训练节点(model-cpk)。标准Tensorflow训练似乎删除了节点,仅保留了最后几个节点。我该如何预防?
如果这是错误的地方,请原谅。如果被告知一个适当的地方,我将不知所措。谢谢。
答案 0 :(得分:1)
您可以对keep_checkpoint_max
中的tf.estimator.RunConfig
使用model_main.py
标志。
您可以将其设置为非常大的数目以实际保存所有检查点。
但是,应警告您,根据型号的大小和保存频率的不同,它可能会填满磁盘(因此在训练过程中会崩溃)。
您可以通过save_checkpoints_steps
的标志save_checkpoints_secs
或RunConfig
更改保存频率。默认值为save_checkpoints_secs
,默认值为600(10分钟)。
答案 1 :(得分:0)
您可以保存模型检查点,因为要对测试数据进行预测时,将再次加载.hdf5文件。 希望有帮助。