如何将新的语料库'保存'到NLTK语料库数据?
就我而言,我在NLTK中创建了一个新的自定义分类语料库,就像在此页面中说的那样:Creating a custom categorized corpus in NLTK and Python
我想使用它就像NLTK中已安装的语料库(比如movie_reviews)。我怎样才能做到这一点?换句话说,我可以如何调用我所读过的新语料库(比如movie_reviews_0):
>>> import nltk
>>> from nltk.corpus import movie_reviews_0
答案 0 :(得分:2)
您可以将其添加到您自己的nltk_data/corpora
文件夹中,该文件夹应位于您主目录中的某个位置。例如,如果你在Mac上,它将在~/nltk_data/corpora
。您似乎还必须将新语料库附加到__init__.py
内的.../site-packages/nltk/corpus/
。