应用错误收集

我一直在尝试使用自己的数据使用OpenNMT-tf（https://github.com/OpenNMT/OpenNMT-tf），这些数据是一系列数字作为源数据，文本句子作为目标。每个语料库大约有20,000行，通常长度不均匀。

当我运行onmt-main infer --config config/opennmt-defaults.yml config/data/toy-ende.yml --features_file data/toy-ende/src-test.txt时，使用新输入的src-test.txt文件，它一遍又一遍地重复与结果相同的句子，这是一个看似随机的句子（并且该句子出现在目标培训数据）。我希望从预测过程中生成与训练数据不同的句子，成为新句子的杂凑（可能具有不同的意识水平）。

我正在使用200000个步骤运行他们的NMTBig模型。波束大小为12，学习为1.0，衰减率为0.7，批处理大小为64，推断批处理大小为30。

我在这里做错什么导致这些重复的结果吗？谁能建议我可以做些什么来达到预期的效果？

测试NMT模型时获得重复的预测

0 个答案: