如何在应用LDA后自动标记主题

时间:2017-10-06 11:58:12

标签: python nltk gensim lda topic-modeling

我已经在python中实现了LDA.now我想标记我从LDA获得的主题。

[(0, u'0.023*"alternate" + 0.023*"transfervisions" + 0.013*"tvcommunity"'), (1, u'0.026*"minimalism" + 0.026*"minimalist" + 0.018*"honking"'), (2, u'0.027*"videomaking" + 0.019*"python" + 0.019*"httpstcoc2ythrctki"')]

2 个答案:

答案 0 :(得分:1)

主题模型的大多数创建者都会将标签分配给主题手动

自动标注可能适用于英语(周围有大量丰富的语言资源),有些提示可以在其他Stackexchange网站上看到这些问题及其答案:

答案 1 :(得分:1)

您可以尝试使用单词向量来平均主题中的前N个单词,然后使用余弦相似度来查找语料库中最接近的单词?