我正在尝试配置jython以使用nltk。为了让jython知道nltk,我将我的机器中安装的python模块的site_packages
的路径("C:\Python27\Lib\site-packages"
)添加到我正在实现的jython项目的外部库中,方法是将路径添加到项目项目属性下的构建路径。
当我导入nltk.book
(from nltk.book import *
)时,出现以下错误:
LookupError:
**********************************************************************
Resource 'corpora/gutenberg' not found. Please use the NLTK
Downloader to obtain the resource: >>> nltk.download()
Searched in:
- 'C:\\Users\\sodara/nltk_data'
- '/usr/share/nltk_data'
- '/usr/local/share/nltk_data'
- '/usr/lib/nltk_data'
- '/usr/local/lib/nltk_data'
我尝试从jython中下载nltk但没有取得多大成功。
相同的代码部分在python中运行完美,没有任何错误。
我正在使用python 2.7和jython 2.5.3。
我发现nltk的python实例在\ AppData \ Roaming \ nltk_data中找到nltk数据
答案 0 :(得分:1)
检查NLTK下载器上的默认下载目录:
import nltk
nltk.download()
最有可能C:\Users\<username>\AppData\Roaming\nltk_data
- 我将其复制到Jython正在查找的目录中。
答案 1 :(得分:0)
如错误所述,您需要使用nltk.download()
在您的代码中添加以下内容:
if not os.path.isdir(os.path.expanduser('~/nltk_data')):
nltk.download(download_dir=os.path.expanduser('~/nltk_data')
您也可以只下载所需的软件包:
nltk.download(package_name, download_dir=os.path.expanduser('~/nltk_data')