使用nltk.download()下载错误

时间:2014-12-26 14:35:06

标签: python python-2.7 ubuntu nltk spyder

我正在使用Python试验NLTK包。我尝试使用nltk.download()下载NLTK。我收到了这种错误信息。如何解决这个问题呢?感谢。

我使用的系统是在VMware下安装的Ubuntu。 IDE是Spyder。

enter image description here

使用nltk.download('all')后,它可以下载一些软件包,但在下载oanc_masc

时会收到错误消息

enter image description here

4 个答案:

答案 0 :(得分:21)

要下载特定数据集/模型,请使用nltk.download()功能,例如如果您要下载punkt句子标记生成器,请使用:

$ python3
>>> import nltk
>>> nltk.download('punkt')

如果您不确定所需的数据/型号,可以从基本的数据+模型列表开始:

>>> import nltk
>>> nltk.download('popular')

它将下载一个"热门"资源。

确保您拥有NLTK的最新版本,因为它始终在改进并不断维护:

$ pip install --upgrade nltk

EDITED

如果有人避免从nltk下载较大数据集时出错,请https://stackoverflow.com/a/38135306/610569

$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.zip
$ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite
$ python

>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it's already installed.
>>> dler.download('popular')

如果有人想查找nltk_data目录,请参阅https://stackoverflow.com/a/36383314/610569

要配置nltk_data路径,请参阅https://stackoverflow.com/a/22987374/610569

答案 1 :(得分:7)

从命令行导入nltk后,尝试

nltk.download('popular', halt_on_error=False)

发生错误后,它会要求重试损坏的包裹,只需拒绝n,它将继续使用正确的包裹。

答案 2 :(得分:0)

a)在OSX中运行

sudo /Applications/Python\ 3.6/Install\ Certificates.command

b)切换为管理员用户(您已设置为具有管理员权限的用户)

并在命令行中输入:

/Applications/Python\ 3.6/Install\ Certificates.command

注释:

  • “ \”是必需的,因为它们会在文件名中转义空白字符。
  • 如果已安装python 3.6,则此过程有效,否则 更改它以匹配您安装的python版本...为此 执行:

ls /Applications

并查看您在那里的python目录名。

答案 3 :(得分:-1)

我遇到了这个错误:

Resource punkt not found. Please use the NLTK Downloader to obtain the resource: import nltk nltk.download('punkt')

当我尝试通过书写来解决:

import nltk

nltk.download()

我的计算机突然关闭,anaconda也关闭了。当我尝试打开它时,总是显示错误。

我通过写来解决了这个问题:

import nltk

nltk.download('punkt')