使print_topics的输出显示unicode字符

时间:2017-08-27 15:29:58

标签: python python-2.7 unicode nltk gensim

当我显示由gensim学习的ldamodel的输出时

ldamodel = gensim.models.ldamodel.LdaModel(corpus, num_topics=2, id2word = dictionary, passes=20)
ldamodel.print_topics(num_topics=2, num_words=4)

它将使用\ u

显示所有unicode字符
[(0,
  u'0.128*"dddf" + 0.128*"\u4f60\u597d" + 0.046*"o" + 0.046*"love"'),
 (1,
  u'0.057*"\u0646\u062f" + 0.057*"\u0627\u06cc\u0646\u0647" + 0.057*"\u0646\u0645\u06cc" + 0.057*"\u0628\u06cc\u0637\u0631\u0641\u0647"')]

那些unicode字符是中文或波斯字符,我应该如何将其显示为那些字符?

0 个答案:

没有答案