NLTK brown.words()返回不同的输出

时间:2015-09-18 07:26:37

标签: python-2.7 nlp nltk

命令

>>> brown.words()

预期输出

['The', 'Fulton', 'County', 'Grand', 'Jury', ...]

但是,当我尝试这个命令时,我得到一个输出

[u'The', u'Fulton', u'County', u'Grand', u'Jury', ...]

任何人都知道为什么会这样?

我正在执行这些步骤

1个已安装的Python 2.7.10 32位版本

2安装了NLTK 3.0.5

3 - 转到Python IDLE

4 - >>> import nltk

5 - >>> nltk.download()然后下载了所需的数据集

6 - >>> from nltk.corpus import brown

7 - >>> brown.words()

1 个答案:

答案 0 :(得分:3)

字符串前面的u表示它被表示为unicode。

请参阅What does the 'u' symbol mean in front of string values?了解解决方案