应用错误收集

训练Seq2Seq模型

时间：2018-08-31 13:55:59

标签： seq2seq

在使用注意力机制的seq2seq模型中。（数据-“康奈尔电影对话”。我想将此模型用于聊天机器人。

我已经训练了大约200个时代。如何知道我的模型已受过足够的训练？

我以前使用的学习率为0.001。然后我使用学习率衰减。但是一段时间之后，学习率变得很小，以至于模型什么也没学到。因此，我手动将其设置为0.0005。对学习率有什么建议吗？

0 个答案:

没有答案