如何使用python删除文件中的特殊字符和停用词?

时间:2019-02-20 13:46:39

标签: python nltk stop-words

我是python的新手,正在努力使代码在不使用nltk的情况下从文件中删除停用词和特殊字符。我尝试阅读其他问题并从中汲取灵感,但没有一个帮助我。

此外,我尝试在PyCharm中安装nltk并将其导入

import nltk

但它说:

  

ModuleNotFoundError:没有名为“ nltk”的模块

有人可以帮我吗?非常感谢

1 个答案:

答案 0 :(得分:1)

如果您使用的是python2.7,请从运行以下命令的终端上安装它:pip install nltk 否则,对于python 3,只需运行pip3 install nltk

如果遇到这种错误

enter image description here

从我们的python控制台运行nltk.download('punkt')(或者您在错误中看到的任何内容,在这里我都打了punkt)

您现在不应该看到任何importError