jython找不到nltk_data

时间:2014-01-15 13:20:45

标签: python jython nltk

我正在尝试配置jython以使用nltk。为了让jython知道nltk,我将我的机器中安装的python模块的site_packages的路径("C:\Python27\Lib\site-packages")添加到我正在实现的jython项目的外部库中,方法是将路径添加到项目项目属性下的构建路径。 当我导入nltk.bookfrom nltk.book import *)时,出现以下错误:

LookupError: 
**********************************************************************
  Resource 'corpora/gutenberg' not found.  Please use the NLTK
  Downloader to obtain the resource:  >>> nltk.download()
  Searched in:
    - 'C:\\Users\\sodara/nltk_data'
    - '/usr/share/nltk_data'
    - '/usr/local/share/nltk_data'
    - '/usr/lib/nltk_data'
    - '/usr/local/lib/nltk_data'

我尝试从jython中下载nltk但没有取得多大成功。

相同的代码部分在python中运行完美,没有任何错误。

我正在使用python 2.7和jython 2.5.3。

我发现nltk的python实例在\ AppData \ Roaming \ nltk_data中找到nltk数据

2 个答案:

答案 0 :(得分:1)

检查NLTK下载器上的默认下载目录:

import nltk
nltk.download()

最有可能C:\Users\<username>\AppData\Roaming\nltk_data - 我将其复制到Jython正在查找的目录中。

答案 1 :(得分:0)

如错误所述,您需要使用nltk.download()

下载数据(语料库和内容)

在您的代码中添加以下内容:

if not os.path.isdir(os.path.expanduser('~/nltk_data')):
    nltk.download(download_dir=os.path.expanduser('~/nltk_data')

您也可以只下载所需的软件包:

nltk.download(package_name, download_dir=os.path.expanduser('~/nltk_data')