安装nltk支持包的错误:nltk.download()

时间:2015-01-03 00:51:02

标签: python python-3.x nltk

我已经安装了nltk包。之后我尝试使用nltk.download()下载支持包,并收到错误:

[Errno 11001] getaddrinfo

我的机器/软件详情如下:

操作系统:Windows 8.1 Python:3.3.4 NLTK套餐:3.0

以下是在python中运行的命令:

Python 3.3.4 (v3.3.4:7ff62415e426, Feb 10 2014, 18:13:51) [MSC v.1600 64 bit (AMD64)] on win32
Type "copyright", "credits" or "license()" for more information.

import nltk

nltk.download()
showing info http://nltk.github.com/nltk_data/
True

nltk.download("all")
[nltk_data] Error loading all: <urlopen error [Errno 11001]
[nltk_data]     getaddrinfo failed>
False

enter image description here

看起来它会转到http://nltk.github.com/nltk_data/,而理想情况下应该尝试从http://www.nltk.org/nltk_data/获取数据。

在我们在浏览器中输入http://nltk.github.com/nltk_data/的另一台计算机上,它会重定向到http://www.nltk.org/nltk_data/。我不明白为什么我的笔记本电脑上没有重定向。

我觉得这可能是个问题。

请帮助。

我添加了命令提示截图。需要帮助..

enter image description here

此致 Bonson

5 个答案:

答案 0 :(得分:3)

得到了解决方案。我的问题是,当NLTK下载程序启动时,服务器索引为 - http://nltk.github.com/nltk_data/

这需要更改为 - http://nltk.org/nltk_data/

您可以通过进入NLTK下载程序窗口和文件 - >更改服务器索引来更改此内容。

此致 Bonson

答案 1 :(得分:1)

由于网络限制,出现此错误。这是我的解决方法

浏览了enter image description here并从相应的链接下载了所需的语料库。

然后将下载的文件放在http://www.nltk.org/nltk_data/

中相同文件夹结构下的Windows C:/文件夹路径中(或其他任何相关目录,例如C:/ProgramData/Anaconda3)中。

答案 2 :(得分:0)

通过“在环境变量中设置http和https代理”为我解决了问题

set http_proxy=http://IPN:PWD@ipaddress:port
set https_proxy=https://IPN:PWD@ipaddress:port

向您的网络或管理团队询问此代理IP地址

答案 3 :(得分:0)

错误可能是系统拥有的代理。请参考以下链接获取答案,并在此处发布答案:

Error in downloading NLTK data: [Errno 11004] getaddrinfo failed

答案 4 :(得分:0)

尝试以下代码。它已按预期下载了软件包

import nltk
import ssl

try:
    _create_unverified_https_context = ssl._create_unverified_context
except AttributeError:
    pass
else:
    ssl._create_default_https_context = _create_unverified_https_context

nltk.download()

通过ssl修复链接断开之前的情况。

注意:-已使用MAC