'u'前置于TextBlob中的所有文本

时间:2015-07-11 06:27:53

标签: python textblob

我使用Textblob处理文本数据。

我的代码是:

from textblob import TextBlob
wiki = TextBlob("Python is a high-level, general-purpose programming language.")
wiki.tags

我的输出为:

[(u'Python', u'NNP'), (u'is', u'VBZ'), (u'a', u'DT'), (u'high-level', u'JJ'), (u'general-purpose', u'JJ'), (u'programming', u'NN'), (u'language', u'NN')]

而不是:

[('Python', 'NNP'), ('is', 'VBZ'), ('a', 'DT'), ('high-level', 'JJ'), ('general-purpose', 'JJ'), ('programming', 'NN'), ('language', 'NN')]

可能有什么理由让'u'字母出现在每个单词的前面?

我正在使用Python 2.7.6版本处理Ubuntu 14.04.2。

1 个答案:

答案 0 :(得分:1)

这是Python的unicode格式表示。这在存储字符串或甚至进行字符串操作时不会产生任何影响。更重要的是,最好有一个标志,表明我们代表的是什么格式,这是Python遵循的惯例。