get_document_topics返回一个空列表。

时间:2018-12-23 04:44:30

标签: python gensim lda topic-modeling

我正在使用gensim进行主题建模。训练了lda模型之后,我在新文档上调用get_document_topics以获取主题分发。但是,对于某些文档,返回值是一个空列表。这是我的代码。知道发生了什么问题吗?

 topic_vector = [ x[1] for x in self.ldamodel.get_document_topics(new_doc_bow , minimum_probability=
0.0, per_word_topics=False)]

1 个答案:

答案 0 :(得分:0)

这是我解决此问题的方法:

首先,请确保您的gensim版本为gensim-3.6.0 您可以通过在终端中运行以下命令来进行检查:

pip freeze | grep gensim

如果没有,您可以卸载gensim并安装较新的版本。 然后,在文件gensim / models / ldamodel.py中,您需要将epsilon的值编辑为更大的值。

DTYPE_TO_EPS = {
    np.float16: 1e-5,
    np.float32: 1e-35, # modify the value and set it to 1e-5 
    np.float64: 1e-100,
}