训练Seq2Seq模型时出现尖峰

时间:2019-11-26 19:21:46

标签: python tensorflow seq2seq

我正在尝试使用keras的机器翻译代码和reddit数据集为seq2seq聊天机器人模型构建模型,但要进行一些修改。 我的代码可以在这里找到-https://github.com/DarshanDeshpande/Seq2Seq-Model/blob/master/Seq2SeqKeras.py

现在,我的问题是,即使调整了学习速度,我的准确性仍然不断下降。这是我的损失和准确性的图表。

Loss Graph

我注意到了峰值,但是我不确定是什么原因造成的。批量大小是否可以太小?如果是这样,如何确定理想值?

0 个答案:

没有答案