urllib2.urlopen引发HTTP错误400:错误请求

时间:2015-04-18 14:31:39

标签: python url pdf download urllib2

我正在尝试使用urllib2下载pdf。问题是它引发了urllib2.HTTPError: HTTP Error 400: Bad Request

我认为问题可能是网址形式。我尝试应用urllib2.quote方法,但没有帮助。

网址:http://www.epi.sk/Main/Download.aspx?fn=\OV\15\OV2015072a$ce10308b-264c-400a-81ad-e643c08a7364.pdf&ofn=15\OV2015072a.pdf

def download_file(download_url,name):
    response = urllib2.urlopen(download_url)
    with open(name, 'wb') as file:
        file.write(response.read())

download_file('http://www.epi.sk/Main/Download.aspx?fn=\OV\15\OV2015072a$ce10308b-264c-400a-81ad-e643c08a7364.pdf&ofn=15\OV2015072a.pdf','files.pdf')

你知道问题出在哪里吗?

1 个答案:

答案 0 :(得分:3)

你的一个反斜杠导致你的一部分字符串被解释为转义序列:

'http://www.epi.sk/Main/Download.aspx?fn=\OV\15\OV2015072a$ce10308b-264c-400a-81ad-e643c08a7364.pdf&ofn=15\OV2015072a.pdf'
                                            ^^^

\15被解释为回车的转义序列:

>>> '\15'
'\r'

将字符串作为原始字符串,前缀为r,Python不会解释这些转义序列:

>>> r'\15'
'\\15'