Question

如果有人能帮我解决这个问题，我将非常感激。

我正在尝试使用请求lib从Internet下载.gz文件。我之前已成功使用lib来获取解析到浏览器的xml数据，但.gz版本无效。

在我的浏览器中单击URL_To_Gzip链接后，.gz文件会自动开始下载该文件。 - ＆GT;所以网址没问题，但只是直接指向文件。

我正在尝试在python 2.7中对此进行编码，以便我可以处理它包含的文件和数据，但是我收到了一条我正在努力解决的错误消息。

错误消息：

HTTPSConnectionPool（host = HOST_URL_TO_GZip，port = 443）：使用url超出最大重试次数：URL_TO_GZip.gz（引起：[Errno 10060]连接尝试失败，因为连接方在一段时间后没有正确响应，或者建立的连接失败，因为连接的主机无法响应）

＆＃13;

import requests 

data = requests.get(url_to_gzip,proxies = {"http":proxy_url}) # Does not work data = #Does not work

data = requests.get(url_to_gzip,proxies = {"http":proxy_url}, stream = True) # Does not work

＆＃13;

Errno 10060上的信息表明错误与我的代理有关，因为无法建立连接。 - ＆GT;但我已成功使用它们来获取类似版本的xml数据。

谢谢，

拉维

修改

URL_TO_GZip.gz文件是通过https：//而工作正常的xml文件是通过http：//我认为这是我的问题的原因以及为什么它适用于一个文件但不适用于另一个文件。

Answer 1

对于遇到此问题的其他人，我需要添加auth =（用户名，密码）关键字来访问HTTPS网站auth keyword。

使用Python Error中的请求下载.gz文件

1 个答案: