在Python中命名LDA主题

时间:2014-11-24 04:15:13

标签: python label lda

我是python的新手并尝试实现主题建模。我使用gensim在pything中成功实现了LDA,但我无法为这些主题提供任何标签/名称。 我们如何命名这些主题?请帮助解决在python中实现的最佳方法。 我的LDA输出有点像这样(如果你需要代码,请告诉我): -

0.024 *研究+ 0.021 *学生+ 0.019 *会议+ 0.019 * chi + 0.017 *领域+ 0.014 *工作+ 0.013 *学生+ 0.013 * hci + 0.013 *组+ 0.013 *研究人员 0.047 *研究+ 0.034 *学生+ 0.020 * ustars + 0.018 *代表不足+ 0.017 *参与者+ 0.012 *研究人员+ 0.012 *数学+ 0.012 *研究生+ 0.012 *数学+ 0.012 *会议 0.027 *学生+ 0.026 *研究+ 0.018 *会议+ 0.017 *领域+ 0.015 *新+ 0.014 *参与者+ 0.013 * chi + 0.012 *机器人+ 0.010 *研究人员+ 0.010 *学生 0.023 *学生+ 0.019 *机器人+ 0.018 *会议+ 0.017 *国际+ 0.016 *互动+ 0.016 *新增+ 0.016 * ph.d。 + 0.016 *符合+ 0.016 * ieee + 0.015 * u.s。 0.033 *研究+ 0.030 *流量+ 0.028 *场+ 0.023 *可视化+ 0.020 *挑战+ 0.017 *学生+ 0.015 *项目+ 0.013 *形状+ 0.013 *视觉+ 0.012 *数据 0.044 *研究+ 0.020 *数学+ 0.017 *程序+ 0.014 * 6月+ 0.014 *会议+ 0.014 * - + 0.013 *数学家+ 0.013 *会议+ 0.011 *字段+ 0.011 * mrc 0.023 *研究+ 0.021 *学生+ 0.015 *场+ 0.014 *悬停+ 0.014 *机制+ 0.014 * dpiv + 0.013 *空气动力学+ 0.012 *不稳定+ 0.012 *会议+ 0.012 *蜂鸟 0.031 *研究+ 0.018 *数学+ 0.016 *程序+ 0.014 *流程+ 0.014 *数学家+ 0.012 *会议+ 0.011 *领域+ 0.011 * 6月+ 0.010 *可视化+ 0.010 *社区 0.028 *学生+ 0.028 *研究+ 0.018 * ustars + 0.018 *数学+ 0.015 *代表不足+ 0.010 *计划+ 0.010 *鼓励+ 0.010 *'',+ 0.010 *参与者+ 0.010 *会议 0.049 *研究+ 0.021 *会议+ 0.021 *计划+ 0.020 *数学+ 0.014 *数学家+ 0.013 *领域+ 0.013 * - + 0.011 *会议+ 0.010 *领域

1 个答案:

答案 0 :(得分:0)

标记主题与主题建模完全不同。这篇文章描述了使用关键字提取技术(KERA)将有意义的标签应用于主题:http://arxiv.org/abs/1308.2359