我需要从ngrams
中提取text
。我正在使用:
from textblob import TextBlob
text = TextBlob('me king of python')
print(text.ngrams(n=3)
将三文组中的文本(我是python之王)分开,它给出了:
[WordList(['me', 'king', 'of']), WordList(['king', 'of', 'python'])]
现在我需要将每个WordList的项目加入:
x = {word for word in ' '.join(text.ngrams(n=3)) }
print x
它给了我以下错误:
TypeError: sequence item 0: expected string or Unicode, WordList found
我知道解决方案很愚蠢,但我不擅长python而且我不理解wordlists
。
答案 0 :(得分:1)
试试这个:
"Wordpress/4.3.1"
更好的是,使用for循环,因为文本可能有多个>>> from textblob import TextBlob
>>> blob = TextBlob('me king of python')
>>> trigram = blob.ngrams(n=3)
>>> for wlist in trigram:
... print ' '.join(wlist)
me king of
king of python
。
使用纯Python也可以实现相同的功能。这是一个例子:
WordLists