我已经在python中实现了LDA.now我想标记我从LDA获得的主题。
[(0, u'0.023*"alternate" + 0.023*"transfervisions" + 0.013*"tvcommunity"'), (1, u'0.026*"minimalism" + 0.026*"minimalist" + 0.018*"honking"'), (2, u'0.027*"videomaking" + 0.019*"python" + 0.019*"httpstcoc2ythrctki"')]
答案 0 :(得分:1)
主题模型的大多数创建者都会将标签分配给主题手动。
自动标注可能适用于英语(周围有大量丰富的语言资源),有些提示可以在其他Stackexchange网站上看到这些问题及其答案:
答案 1 :(得分:1)
您可以尝试使用单词向量来平均主题中的前N个单词,然后使用余弦相似度来查找语料库中最接近的单词?