如何在NLTK中保存自定义分类语料库

时间:2013-03-25 09:20:57

标签: python nlp nltk

如何将新的语料库'保存'到NLTK语料库数据?

就我而言,我在NLTK中创建了一个新的自定义分类语料库,就像在此页面中说的那样:Creating a custom categorized corpus in NLTK and Python

我想使用它就像NLTK中已安装的语料库(比如movie_reviews)。我怎样才能做到这一点?换句话说,我可以如何调用我所读过的新语料库(比如movie_reviews_0):

>>> import nltk
>>> from nltk.corpus import movie_reviews_0

1 个答案:

答案 0 :(得分:2)

您可以将其添加到您自己的nltk_data/corpora文件夹中,该文件夹应位于您主目录中的某个位置。例如,如果你在Mac上,它将在~/nltk_data/corpora。您似乎还必须将新语料库附加到__init__.py内的.../site-packages/nltk/corpus/