应用错误收集

我正在尝试使用来自stevenloria.com（http://stevenloria.com/finding-important-words-in-a-document-using-tf-idf/）的tf-idf脚本，我还想使用NLTK语料库（Extracting only meaningful text from webpages）删除文本中的停用词。我注意到在tf-idf中，列表中的文本是完整的并且在枚举中被进一步分割。但是当我尝试删除tf-idf文本中的单词时，它会抛出错误“停止单词列表不可用”。有人能告诉我如何实现这个目标吗？

如何在使用tf-idf时删除停用词

0 个答案: