标签: seq2seq
在使用注意力机制的seq2seq模型中。 (数据-“康奈尔电影对话”。我想将此模型用于聊天机器人。
我已经训练了大约200个时代。如何知道我的模型已受过足够的训练?
我以前使用的学习率为0.001。然后我使用学习率衰减。但是一段时间之后,学习率变得很小,以至于模型什么也没学到。因此,我手动将其设置为0.0005。对学习率有什么建议吗?