在python中加入WordLists

时间:2015-10-22 15:47:24

标签: python textblob

我需要从ngrams中提取text。我正在使用:

from textblob import TextBlob
text = TextBlob('me king of python')
print(text.ngrams(n=3)

将三文组中的文本(我是python之王)分开,它给出了:

[WordList(['me', 'king', 'of']), WordList(['king', 'of', 'python'])]

现在我需要将每个WordList的项目加入:

x = {word for word in ' '.join(text.ngrams(n=3)) }
print x

它给了我以下错误:

TypeError: sequence item 0: expected string or Unicode, WordList found

我知道解决方案很愚蠢,但我不擅长python而且我不理解wordlists

1 个答案:

答案 0 :(得分:1)

试试这个:

"Wordpress/4.3.1"

更好的是,使用for循环,因为文本可能有多个>>> from textblob import TextBlob >>> blob = TextBlob('me king of python') >>> trigram = blob.ngrams(n=3) >>> for wlist in trigram: ... print ' '.join(wlist) me king of king of python

更新

使用纯Python也可以实现相同的功能。这是一个例子:

WordLists