应用错误收集

如何将文本列表转换为Mallet语料库？

时间：2016-03-21 13:42:52

标签： python nlp lda gensim mallet

我有一大堆文本，表示为文本列表：

[text1，text2，...，textn]

我还有一份这些文字的名单：

[text1_name，text2_name，...，textn_name]

如何将此类数据转换为Mallet Corpus？那么可以使用gensim的LDA吗？

from gensim.models.ldamulticore import LdaMulticore
corpus = gensim.corpora.MalletCorpus( **what_should_stay_here??** )
lda = LdaMulticore(corpus, workers = -1)

0 个答案:

没有答案