Question

命令

>>> brown.words()

预期输出

['The', 'Fulton', 'County', 'Grand', 'Jury', ...]

但是，当我尝试这个命令时，我得到一个输出

[u'The', u'Fulton', u'County', u'Grand', u'Jury', ...]

任何人都知道为什么会这样？

我正在执行这些步骤

1个已安装的Python 2.7.10 32位版本

2安装了NLTK 3.0.5

3 - 转到Python IDLE

4 - >>> import nltk

5 - >>> nltk.download()然后下载了所需的数据集

6 - >>> from nltk.corpus import brown

7 - >>> brown.words()

Answer 1

字符串前面的u表示它被表示为unicode。