如何用不以.pdf结尾的python下载PDF文件

时间:2019-11-19 13:46:17

标签: python python-3.x pdf web web-scraping

URL看起来像这样:https://apps.websitename.com/AccountOnlineWeb/AccountOnlineCommand?command=getBlobImage&image=11/19/2019我已经尝试了一切。但是他们都不起作用。

import requests
from requests.auth import HTTPBasicAuth

url ='https://apps.websitename.com/AccountOnlineWeb/AccountOnlineCommand?command=getBlobImage&image=11/19/2019'
s = requests.Session()
r = requests.get(url, allow_redirects=True, auth=HTTPBasicAuth('username', 'password'))
with open('filepath/file.pdf', 'wb')as f:
    f.write(r.content)

我测试了从网站获取一个.jpg文件,以确保身份验证部分正在运行。我下载了一个未经验证的.pdf网址文件,以确保下载pdf正常。但是我无法下载该文件。 我使用r.is_redirect测试了网址是否重定向到PDF的另一个网址,但返回了False 我应该提到的是,当您手动打开文件时,它只等待2秒,然后像常规PDF一样加载PDF,就可以像常规PDF一样下载它。 目前,我的代码下载的文件应该是PDF,但文件大小为0 KB。

0 个答案:

没有答案