标签: python lda gensim
我知道在训练了gensim的lda模型之后,我们可以通过以下方式获得一个看不见的文档的主题:
lda = LdaModel(corpus, num_topics=10) doc_lda = lda[doc_bow]
但是已经用于培训的文件怎么样?我的意思是有没有办法在培训中使用语料库中的文档而不像新文档那样对待它?
答案 0 :(得分:6)
没有
来自单个文档的信息被提炼到模型中,然后被遗忘。 不保留每个文档的信息(更一般地说:不保留需要O(#docs)内存的信息。
O(#docs)