我在一个小测试集上运行文本解码(5个示例),但参考文件和解码文件都已经有数千行。有没有理由解码看似无限期?它是否反复处理同一组例子?后来的产出应该比早先的更好吗?
会对此有一些直觉;我还没有找到明确的解释。
答案 0 :(得分:0)
是的,你的想法是正确的,重复使用相同的输入来生成输出。但是,您可以将输出限制为仅一个。我之前通过修改seq2seq_attention_decode.py将输出写入文件来实现。我只给了一个输入,所以在一次输出后,我希望它停止。
有没有理由解码看似无限期地运行?:它只是我的直觉,它预计会在不同的运行中给出不同的总结。当解码在与训练它不同的机器上运行时,它应该使用生成新模型,因此给出不同的输出。随着培训过程的继续,这可能是一种监测产出变化的方法。