在尝试为较小的语料库计算lda时在python中获取此错误,但在其他情况下工作正常。
语料库的大小是15,我尝试将主题数设置为5,然后将其减少为2,但仍然会出现相同的错误: ValueError:无法计算空集合的LDA(无条件)
在此行收到错误:lda = models.LdaModel(corpus, num_topics=topic_number, id2word=dictionary, passes=passes)
其中语料库为corpus = [dictionary.doc2bow(text) for a, id, text, s_date, e_date, qd, qd_perc in texts]
为什么不给出任何条款?
答案 0 :(得分:1)
因此,小文档的问题在于,如果您尝试从字典中过滤极值,则最终可能会在语料库中使用空列表。corpus = [dictionary.doc2bow(text)]
。
因此,dictionary.filter_extremes(no_below=2, no_above=0.1)
corpus = [dictionary.doc2bow(text)]
中的参数值
我刚刚删除了过滤器极限,lda模型现在运行正常。虽然我将更改filter extreme中的参数值,但稍后会使用它。