代码:
from nltk.corpus import indian
nltk.corpus.indian.words('hindi.pos')
输出:
[u'\u092a\u0942\u0930\u094d\u0923', u'\u092a\u094d\u0930\u0924\u093f\u092c\u0902\u0927', ...]
但是,我需要输出为:['पूर्ण', 'प्रतिबंध', 'हटाओ', ':', 'इराक', 'संयुक्त', ...]
如下所示:http://www.nltk.org/book/ch02.html
请问您如何打印实际的单词而不是unicode。 任何帮助表示赞赏。
答案 0 :(得分:0)
Python 2没有VM范围的Unicode支持。 prettyprinter与打印数组中的一个字符串不同 - 但只打印一个将按预期工作。