是否可以使用 NLTK 在给定文字中显示哪些字词填充词? 如果没有,有谁知道我可以在哪里获得带有英文填充词的 wordlist ? 谢谢
已解决:来自nltk.corpus导入停用词
答案 0 :(得分:3)
NLTK本身并没有提供这样的列表,尽管很多都可以在网上的其他地方找到。
有很多来源:网页搜索“亵渎”“badwords.txt”或 blacklists.txt 的单词列表产生了很多来源。
在我们公司的案例中,我们最终创建了自己的列表并根据需要添加了它。根据您的受众,必须对列表进行调整和调整。
最后,即使这个SO question已关闭(以及关于php),我发现引用和讨论非常有用。
更新:您想要的是停用词的列表。
希望有所帮助。