语言模型的困惑如何在0和1之间?

时间:2017-07-02 16:56:19

标签: python tensorflow language-model sequence-to-sequence perplexity

在Tensorflow中,我得到的输出如0.602129或0.663941。似乎接近0的值意味着更好的模型,但似乎困惑应该被计算为2 ^损失,这意味着损失是负的。这没有任何意义。

1 个答案:

答案 0 :(得分:1)

这对我来说没有多大意义。困惑计算为2^entropy。并且熵是从0到1.所以你的结果是< 1没有意义。

我建议你看看你的模型如何计算困惑,因为我怀疑可能有错误。