自然语言生成评估

时间:2018-03-31 11:53:34

标签: machine-learning lstm

我正在使用LSTM网络制作自然语言生成器,但现在我陷入了部分,如何评估我的输出。假设我有一个输入训练数据集,其中包含对话行为表示和该特定对话行为的正确输出。现在假设我从我的LSTM网络生成输出句子y,那么如何评估该句子与数据集中的句子相比较。我的意思是有没有办法比较输出,以便我可以使用梯度下降来训练我的权重。

1 个答案:

答案 0 :(得分:1)

一旦找到答案,你就能写一篇关于它的好文章,因为那是一个公开的研究问题。 :)

据我所知,您的评估必须结合输出的语法和语义合理性,语境连贯性,个性一致性和话语动态进展。关于如何以最佳方式衡量这些问题尚未达成共识,但目前有大量关于该主题的论文。

Liu等人的相关介绍性阅读:https://arxiv.org/abs/1603.08023