将其他停用词添加到nltk.corpus.stopwords.words('english')列表或作为集合更新将返回NoneType对象

时间:2018-07-02 07:13:32

标签: python python-3.x

我尝试将nltk的停用词附加到列表和集合上。但是,它返回一个NoneType对象。我使用了以下方法:

  1. 扩展列表:

    stopword = list(stopwords.words('english'))

    stopword = stopword.extend([['maggi','maggie','#maggi','#maggie'])

    打印(停用词)

      

    没有

  2. 更新集合

    停用词= set(stopwords.words('english'))

    停用词= stopword.update(set([['maggi','maggie','#maggi','#maggie']))

    打印(停用词)

      

    没有

1 个答案:

答案 0 :(得分:0)

stopwords.words('english')已经是一个列表,因此您无需再次转换为该列表。 在使用提供无类型输出的list.extend()的地方,我们可以创建另一个列表并将其添加到停用词中。 因此,以下代码将完成任务并获得输出

from nltk.corpus import stopwords
stopword = list(stopwords.words('english'))
l = ['maggi','maggie','#maggi','#maggie']
stopword = stopword + l
print(stopword)