命令
>>> brown.words()
预期输出
['The', 'Fulton', 'County', 'Grand', 'Jury', ...]
但是,当我尝试这个命令时,我得到一个输出
[u'The', u'Fulton', u'County', u'Grand', u'Jury', ...]
任何人都知道为什么会这样?
我正在执行这些步骤
1个已安装的Python 2.7.10 32位版本
2安装了NLTK 3.0.5
3 - 转到Python IDLE
4 - >>> import nltk
5 - >>> nltk.download()
然后下载了所需的数据集
6 - >>> from nltk.corpus import brown
7 - >>> brown.words()
答案 0 :(得分:3)
字符串前面的u表示它被表示为unicode。
请参阅What does the 'u' symbol mean in front of string values?了解解决方案