下载pdf表格amazonaws时回复是空白的

时间:2016-06-20 09:48:45

标签: python amazon-web-services http-headers python-requests request-headers

我正在尝试使用python 2.7请求从此link下载pdf文件:

https://ap-prod-ddc-stack-content.s3.amazonaws.com/devtestbed-prod-01/ABC000128CEC2.pdf?AWSAccessKeyId=AKIAJZ2VLLVH5FAWOGYA&Expires=1466500635&Signature=itUWZwiOiWwH%2BPihTYMjoq1URFw%3D

import requests
headers={
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.107 Safari/537.36'
    }
download_url="https://ap-prod-ddc-stack-content.s3.amazonaws.com/devtestbed-prod-01/ABC000128CEC2.pdf?AWSAccessKeyId=AKIAJZ2VLLVH5FAWOGYA&Expires=1466500635&Signature=itUWZwiOiWwH%2BPihTYMjoq1URFw%3D"
response=  requests.get(download_url,headers=headers )
print response
print  "##################"
print response.content

GET 请求的回复中,我收到代码 200 ,但内容为空。

我的代码中缺少的是什么。

1 个答案:

答案 0 :(得分:2)

接下来您需要做的就是将内容保存为文件(使用' wb'标志)而不是字符串,因为内容是字节代码。

将此添加到代码的末尾:

with open('PATH\downloaded.pdf', 'wb') as file:
    file.write(response.content)

注意:我使用了python3.4,它对我有用。