加载计算的LDA模型并打印每个主题最常用的单词

时间:2017-03-09 14:08:16

标签: python gensim topic-modeling

我是python的新手。我想要做的是通过控制台读取2个参数。

  1. 参数:具有gensim的训练LDA模型的路径。
  2. 参数:我想要获得的每个主题最常见的单词数。
  3. 现在,我想为所有主题打印每个主题最常用单词的数量。现在我的问题是如何获得所有主题。

    这是我到目前为止所做的:

    import sys, getopt
    import gensim
    
    def main(argv):
       input_file = argv[0] #LDA Path
       number_of_words = argv[1] #Number of most common word per topic
    
       ldamodel = gensim.models.ldamodel.LdaModel.load(input_file, mmap=None) #load model
       ldamodel.print_topic(?, number_of_words)
    
    
    
    if __name__ == "__main__":
       main(sys.argv[1:])
    

    Gensim doc

    由于

1 个答案:

答案 0 :(得分:0)

get_topic_terms做你想要的。我认为主题数量存储在num_topics变量中,可通过ldamodel.num_topics访问。