SKlearn LDA与Gensim LDA的困惑比较问题

时间:2016-11-10 10:04:40

标签: python scikit-learn nlp lda gensim

我将lda与sklearn和gensim一起使用。然后我检查了保持数据的困惑。

我正在获得gensim的困惑和sklearn的perpleixy的正值的negetive值。我如何比较这些值。

sklearn perplexity = 417185.466838

gensim perplexity = -9212485.38144

1 个答案:

答案 0 :(得分:1)

为了比较困惑,您需要使用np.exp(-1. * gensim_model.log_perplexity(train_corpus))转换gensim的困惑。

有关Gensim和Sklearn LDA实施的一般比较,请参阅here