有没有办法在nltk寻找wordnet语料库的地方列表中添加新位置?

时间:2012-11-01 04:25:05

标签: python ubuntu nltk

我无法使用nltk wordnet lemmatizer,因为访问权限问题导致我无法在大学计算机上下载wordnet语料库。

我尝试这样做时出现以下错误:

**********************************************************************   Resource 'corpora/wordnet' not found.  Please use the NLTK   Downloader to obtain the resource:  >>> nltk.download()   Searched in:
    - '/home/XX/nltk_data'
    - '/usr/share/nltk_data'
    - '/usr/local/share/nltk_data'
    - '/usr/lib/nltk_data'
    - '/usr/local/lib/nltk_data'
**********************************************************************

当我在家里遇到同样的问题时,我可以通过两种方式解决它:

  1. 使用nltk.download(),标准方式和
  2. 在位置/ home / XX / nltk_data创建一个新文件夹,然后粘贴其中的语料库目录。
  3. 现在在大学我只能直接访问/ home / XX / bin而不是/ home / XX。那么无论如何我可以将wordnet语料库粘贴到/ home / XX / bin中,然后以某种方式让nltk在该文件夹中查找语料库?

2 个答案:

答案 0 :(得分:4)

设置NLTK_DATA environment variable

export NLTK_DATA=/path/to/nltk_data

答案 1 :(得分:0)

在这种情况下,

virtualenv也是一种选择。