ValueError:无法在空集合上计算LDA(无条件)

时间:2016-11-28 09:18:16

标签: python python-3.x gensim lda

在尝试为较小的语料库计算lda时在python中获取此错误,但在其他情况下工作正常。

语料库的大小是15,我尝试将主题数设置为5,然后将其减少为2,但仍然会出现相同的错误: ValueError:无法计算空集合的LDA(无条件)

在此行收到错误:lda = models.LdaModel(corpus, num_topics=topic_number, id2word=dictionary, passes=passes)

其中语料库为corpus = [dictionary.doc2bow(text) for a, id, text, s_date, e_date, qd, qd_perc in texts]

为什么不给出任何条款?

1 个答案:

答案 0 :(得分:1)

因此,小文档的问题在于,如果您尝试从字典中过滤极值,则最终可能会在语料库中使用空列表。corpus = [dictionary.doc2bow(text)]

因此,dictionary.filter_extremes(no_below=2, no_above=0.1)

之前需要相应地仔细选择corpus = [dictionary.doc2bow(text)]中的参数值

我刚刚删除了过滤器极限,lda模型现在运行正常。虽然我将更改filter extreme中的参数值,但稍后会使用它。