我将lda与sklearn和gensim一起使用。然后我检查了保持数据的困惑。
我正在获得gensim的困惑和sklearn的perpleixy的正值的negetive值。我如何比较这些值。
sklearn perplexity = 417185.466838
gensim perplexity = -9212485.38144
答案 0 :(得分:1)
为了比较困惑,您需要使用np.exp(-1. * gensim_model.log_perplexity(train_corpus))
转换gensim的困惑。
有关Gensim和Sklearn LDA实施的一般比较,请参阅here。