我想要完成的是从以下链接下载.xlsx文件: https://......./something.do?parameter=[parameter_value]
请注意,显示确切的链接毫无意义,因为它是内部链接。
问题是如果我在浏览器中打开链接,则会自动开始下载。但是,当我想以编程方式执行此操作时,我无法获得该文件的确切链接。
我发现在http响应标头中,content-disposition属性包含如下文件名: 内容 - 处理:附件;文件名= “ABCD.xlsx”
但到目前为止我无法捕获该文件,只能访问网站的html代码。
目前我的python代码如下所示:
import requests
urlBase = 'link to the authetication page'
urlFile = 'https://......./something.do?parameter=[parameter_value]' //like the above link
user = 'username'
pw = 'password'
session = requests.Session()
session.auth = (user, pw)
auth = session.post(urlBase)
response = session.get(urlFile)
响应当前显示的是html代码。
提前致谢