我正在使用gensim进行主题建模。训练了lda模型之后,我在新文档上调用get_document_topics以获取主题分发。但是,对于某些文档,返回值是一个空列表。这是我的代码。知道发生了什么问题吗?
topic_vector = [ x[1] for x in self.ldamodel.get_document_topics(new_doc_bow , minimum_probability=
0.0, per_word_topics=False)]
答案 0 :(得分:0)
这是我解决此问题的方法:
首先,请确保您的gensim版本为gensim-3.6.0 您可以通过在终端中运行以下命令来进行检查:
pip freeze | grep gensim
如果没有,您可以卸载gensim并安装较新的版本。 然后,在文件gensim / models / ldamodel.py中,您需要将epsilon的值编辑为更大的值。
DTYPE_TO_EPS = {
np.float16: 1e-5,
np.float32: 1e-35, # modify the value and set it to 1e-5
np.float64: 1e-100,
}