标签: gensim lda topic-modeling
尝试对从生成器生成的数据集执行LDA。数据集包括我想要归类为不同文档的数据块。
假设数据块由文本文件中的空行分隔
但形成的语料库的文件数量太少。怎么克服这个? 感谢