因此,我一直在尝试通过删除停用词和计数少于1000的单词来清理我的单词词典数据。
from nltk.corpus import stopwords
def cleanSmallData():
stop_words = set(stopwords.words('english'))
delete = [key for key in totalWordsDict if totalWordsDict[key] < 1000]
for key in delete:
del totalWordsDict[key]
##Stopword Filter
delete1 = [key for key in totalWordsDict if not key in stop_words]
for key in delete1:
del totalWordsDict[key]
totalWordsDict是一个包含单词键和计数值的字典。 在注释掉导入和停用词过滤器之后的代码后运行此代码时,它工作正常。
这是我一直遇到的错误: ModuleNotFoundError:没有名为“ nltk”的模块
我已经为Python 3.8.2 pip安装了nltk(与我在其上运行此代码的安装相同),并使用nltk.download('all')通过外壳下载了其所有软件包,但是我仍然遇到这个错误。