有没有办法将wordcloud中的单词组合成一个词?
给出以下示例,我想让wordcloud识别以下单词:
房地产
代理史密斯
忍者
西斯警官
超级士兵
from wordcloud import WordCloud, STOPWORDS
from matplotlib import pyplot as plt
job_description = ['real estate agent', 'real estate agent', 'real estate agent', 'real estate agent',
'agent smith', 'agent smith', 'agent smith',
'super ninja', 'trooper ninja', 'flying ninja', 'bearded ninja', 'cloaking ninja',
'sith trooper', 'sith trooper', 'sith trooper', 'sith trooper',
'super trooper']
# Create word string
words = ' '.join(job_description)
# Create stopwords
stopwords = set(STOPWORDS)
stopwords.update(['agent',
'trooper',
'super',
'flying',
'bearded',
'cloaking'])
#Generate word cloud
wordcloud = WordCloud(stopwords=stopwords, background_color="black", collocations=False, width=800, height=400).generate(words)
#Plot word cloud
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
因此,举例来说,我希望wordcloud将房地产视为一个术语,尽管“代理”是我的停用词之一,但我仍然希望将“代理史密斯”作为一个术语。
我知道停用词会从字符串中删除给定的词,并且如果我用下划线替换它们之间的空格,则能够保留术语,但是想知道是否为此使用了wordcloud函数吗? 抱歉,如果我错过了文档中的任何内容。