测试NMT模型时获得重复的预测

时间:2018-09-13 19:56:50

标签: python tensorflow opennmt

我一直在尝试使用自己的数据使用OpenNMT-tf(https://github.com/OpenNMT/OpenNMT-tf),这些数据是一系列数字作为源数据,文本句子作为目标。每个语料库大约有20,000行,通常长度不均匀。

当我运行onmt-main infer --config config/opennmt-defaults.yml config/data/toy-ende.yml --features_file data/toy-ende/src-test.txt时,使用新输入的src-test.txt文件,它一遍又一遍地重复与结果相同的句子,这是一个看似随机的句子(并且该句子出现在目标培训数据)。我希望从预测过程中生成与训练数据不同的句子,成为新句子的杂凑(可能具有不同的意识水平)。

我正在使用200000个步骤运行他们的NMTBig模型。波束大小为12,学习为1.0,衰减率为0.7,批处理大小为64,推断批处理大小为30。

我在这里做错什么导致这些重复的结果吗?谁能建议我可以做些什么来达到预期的效果?

0 个答案:

没有答案