代码的最后部分:
lda = models.LdaModel(corpus_tfidf, id2word = dic, num_topics = 64)
corpus_lda = lda[corpus_tfidf]
我想知道如何保存corpus_lda以供进一步使用?
答案 0 :(得分:2)
Gensim具有将语料库写入磁盘的功能:
from Gensim import corpora
corpora.MmCorpus.serialize('pathandfilename.mm', corpus_lda)
要加载已保存的语料库使用:
corpus_lda = corpora.MmCorpus('pathandfilename.mm')
保存模型有类似的功能(查看教程或references)。 有不同的语料库格式,我相信矩阵市场曾经是Gensim使用的标准格式,但最近添加了indexedcorpus格式,它有一些额外的功能(索引,你可能已经猜到了)。