def generateTopics(corpus, dictionary):
# Build LDA model using the above corpus
lda = models.ldamodel.LdaModel(corpus, id2word=dictionary, num_topics=50)
corpus_lda = lda[corpus]
# Group topics with similar words together.
tops = set(lda.show_topics(50))
top_clusters = []
for l in tops:
top = []
for t in l.split(" + "):
top.append((t.split("*")[0], t.split("*")[1]))
top_clusters.append(top)
我正在尝试使用lda获取主题。但在此代码中,当我尝试将具有相似单词的主题分组在一起时,我得到此错误。 对于l.split中的t(" +"): AttributeError:'元组'对象没有属性' split'
答案 0 :(得分:0)
您只能拆分字符串。
尝试
str(l).split(" + ")
否则,请勿使用元组。