模型评估指标中的Bleu分数

时间:2019-02-05 14:17:37

标签: keras seq2seq bleu

在许多seq2seq实现中,我看到它们在编译模型时使用准确性指标,而在预测中仅使用 Bleu得分

为什么他们在训练中不使用Bleu评分来提高效率?如果我理解正确!

1 个答案:

答案 0 :(得分:1)

双语评估学习不足分数是用来代替人类的,因此,名字是单词understtudy。

现在,当您训练数据时,您已经有了目标值,可以直接将生成的结果与目标值进行比较,但是当您对数据集进行预测时,就没有办法测量句子是否翻译成正确的。这就是您使用Bleu的原因,因为在每次机器翻译后,没有人可以检查您所预测的内容是否正确,并且Bleu提供了健全性检查。

P.S。学习不足是指某人向导师学习以替换他,如果需要,布鲁会从人类那里“学习”,然后能够对翻译进行评分。

有关更多信息,请查看https://www.youtube.com/watch?v=9ZvTxChwg9A&list=PL1w8k37X_6L_s4ncq-swTBvKDWnRSrinI&index=28

如有疑问,请在下面评论。