如何从具有可下载内容的URL获取文件名和类型?

时间:2018-08-18 05:08:36

标签: python

这是一个示例excel文件的链接:Sample excel file

当我们在浏览器中点击该URL时,它会自动获取名称和扩展名,例如,在上述URL的情况下,它是 Financial Sample.xlsx

如何使用Python获取此信息?

我正在使用urllib.request.urlretrieve("http://go.microsoft.com/fwlink/?LinkID=521962", "Newname.extension")

保存此文件

上面的方法工作正常,即在保存之前提供自定义名称时。但是,我想要原始名称和扩展名。

1 个答案:

答案 0 :(得分:0)

从此Stack overflow post

找到了答案
from os.path import basename
from urllib.request import urlopen    
url = 'http://go.microsoft.com/fwlink/?LinkID=521962'
response = urlopen(url)
response.url
basename(response.url)

basename(response.url)返回 Financial Sample.xlsx