Question

我正在尝试使用python 2.7请求从此link下载pdf文件：

https://ap-prod-ddc-stack-content.s3.amazonaws.com/devtestbed-prod-01/ABC000128CEC2.pdf?AWSAccessKeyId=AKIAJZ2VLLVH5FAWOGYA&Expires=1466500635&Signature=itUWZwiOiWwH%2BPihTYMjoq1URFw%3D

import requests
headers={
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.107 Safari/537.36'
    }
download_url="https://ap-prod-ddc-stack-content.s3.amazonaws.com/devtestbed-prod-01/ABC000128CEC2.pdf?AWSAccessKeyId=AKIAJZ2VLLVH5FAWOGYA&Expires=1466500635&Signature=itUWZwiOiWwH%2BPihTYMjoq1URFw%3D"
response=  requests.get(download_url,headers=headers )
print response
print  "##################"
print response.content

在 GET 请求的回复中，我收到代码 200 ，但内容为空。

我的代码中缺少的是什么。

Answer 1

接下来您需要做的就是将内容保存为文件（使用＆＃39; wb＆＃39;标志）而不是字符串，因为内容是字节代码。

将此添加到代码的末尾：

with open('PATH\downloaded.pdf', 'wb') as file:
    file.write(response.content)

注意：我使用了python3.4，它对我有用。

下载pdf表格amazonaws时回复是空白的

1 个答案: