标签: python nlp stemming stop-words
我有一个有点大的文档,想要使用Python来删除和删除本文档中的单词。有谁知道这些货架包装? 如果不是,也欢迎对大型文档足够快的代码。 感谢
答案 0 :(得分:8)
NLTK支持此功能。
答案 1 :(得分:4)
如果由于某种原因你不想使用NLTK,你可以试试PyStemmer。对于停用词,只需下载一个列表(谷歌)并过滤掉它们。