我的问题很简单,但是(到目前为止)我无法在网上找到明确的答案。
在定义次数的训练后,我使用adam优化器训练的keras模型的权重已保存下来:
callback = tf.keras.callbacks.ModelCheckpoint(filepath=path, save_weights_only=True)
model.fit(X,y,callbacks=[callback])
当我关闭jupyter后恢复训练时,我可以简单地使用:
model.load_weights(path)
继续训练。
由于Adam取决于时期数(例如学习率下降的情况),所以我想知道在与以前相同的条件下恢复训练的最简单方法。
按照ibarrond的回答,我编写了一个小的自定义回调。
optim = tf.keras.optimizers.Adam()
model.compile(optimizer=optim, loss='categorical_crossentropy',metrics=['accuracy'])
weight_callback = tf.keras.callbacks.ModelCheckpoint(filepath=checkpoint_path, save_weights_only=True, verbose=1, save_best_only=False)
class optim_callback(tf.keras.callbacks.Callback):
'''Custom callback to save optimiser state'''
def on_epoch_end(self,epoch,logs=None):
optim_state = tf.keras.optimizers.Adam.get_config(optim)
with open(optim_state_pkl,'wb') as f_out:
pickle.dump(optim_state,f_out)
model.fit(X,y,callbacks=[weight_callback,optim_callback()])
当我恢复训练时:
model.load_weights(checkpoint_path)
with open(optim_state_pkl,'rb') as f_out:
optim_state = pickle.load(f_out)
tf.keras.optimizers.Adam.from_config(optim_state)
我只想检查一下是否正确。再次非常感谢!
附录:在进一步阅读Adam的默认Keras implementation和original Adam paper时,我相信默认的Adam并不依赖于时期号,而仅依赖于迭代次数。因此,这是不必要的。但是,该代码对于希望跟踪其他优化程序的任何人可能仍然有用。
答案 0 :(得分:5)
为了完美地捕获优化器的状态,您应该使用功能get_config()
存储其配置。此函数返回一个词典(包含选项),该词典可以使用pickle
进行序列化并存储在文件中。
要重新启动该过程,只需d = pickle.load('my_saved_tfconf.txt')
即可检索具有配置的词典,然后使用Keras Adam Optimizer.的函数from_config(d)
生成您的Adam Optimizer。