nltk pos tag expletives

时间:2012-12-08 11:14:29

标签: python tags nltk part-of-speech

是否可以使用 NLTK 在给定文字中显示哪些字词填充词? 如果没有,有谁知道我可以在哪里获得带有英文填充词的 wordlist ? 谢谢

已解决:来自nltk.corpus导入停用词

1 个答案:

答案 0 :(得分:3)

NLTK本身并没有提供这样的列表,尽管很多都可以在网上的其他地方找到。

有很多来源:网页搜索“亵渎“badwords.txt” blacklists.txt 的单词列表产生了很多来源。

在我们公司的案例中,我们最终创建了自己的列表并根据需要添加了它。根据您的受众,必须对列表进行调整和调整。

最后,即使这个SO question已关闭(以及关于php),我发现引用和讨论非常有用。

更新:您想要的是停用词的列表。

  1. 尝试:http://www.ranks.nl/resources/stopwords.html
  2. MIT also maintains a list停止词。
  3. 希望有所帮助。