如何在使用tf-idf时删除停用词

时间:2015-06-01 18:41:19

标签: nltk tf-idf stop-words

我正在尝试使用来自stevenloria.com(http://stevenloria.com/finding-important-words-in-a-document-using-tf-idf/)的tf-idf脚本,我还想使用NLTK语料库(Extracting only meaningful text from webpages)删除文本中的停用词。我注意到在tf-idf中,列表中的文本是完整的并且在枚举中被进一步分割。但是当我尝试删除tf-idf文本中的单词时,它会抛出错误“停止单词列表不可用”。有人能告诉我如何实现这个目标吗?

0 个答案:

没有答案