使用colab时,没有这样的文件或目录'nltk_data / corpora / stopwords / English'

时间:2018-12-14 02:56:11

标签: python nlp nltk google-colaboratory

首先,我使用Google colab进行工作, 我已经用以下命令下载了英语的nltk停用词:

nltk.download('stopwords')

下载成功

[nltk_data] Downloading package stopwords to /root/nltk_data...

但是当我运行stop = stopwords.words('English')

我得到OSError: No such file or directory: '/root/nltk_data/corpora/stopwords/English'

1 个答案:

答案 0 :(得分:5)

TL; DR

English应该是小写=)

请参阅:https://colab.research.google.com/drive/1tNt0Ifom-h4OnFBBZpLndYCEPDU598jE

在代码中

# Downloads the data.
import nltk
nltk.download('stopwords')


# Using the stopwords.
from nltk.corpus import stopwords

# Initialize the stopwords
stoplist = stopwords.words('english')