如何在NLTK的印度语料库中打印印地语单词?

时间:2016-11-25 01:15:32

标签: python unicode nlp nltk

代码:

from nltk.corpus import indian

nltk.corpus.indian.words('hindi.pos')

输出:

[u'\u092a\u0942\u0930\u094d\u0923', u'\u092a\u094d\u0930\u0924\u093f\u092c\u0902\u0927', ...]

但是,我需要输出为:['पूर्ण', 'प्रतिबंध', 'हटाओ', ':', 'इराक', 'संयुक्त', ...] 如下所示:http://www.nltk.org/book/ch02.html

请问您如何打印实际的单词而不是unicode。 任何帮助表示赞赏。

1 个答案:

答案 0 :(得分:0)

Python 2没有VM范围的Unicode支持。 prettyprinter与打印数组中的一个字符串不同 - 但只打印一个将按预期工作。