我正在Python中创建一个HTTP客户端下载程序。我可以正确下载http://www.google.com/images/srpr/logo11w.png这样的文件。但是,我不确定实际上名称该做什么。
网址末尾当然有文件名,但这总是可靠的吗?
答案 0 :(得分:1)
如果我没记错的话,wget使用以下启发式方法:
Content-Disposition
标头,请从那里获取文件名。http://myserver/filename
),请使用该文件。http://www.google.com
),请从Content-Type
标题中导出文件名(例如index.html
的{{1}})text/html
或覆盖,具体取决于配置。还有很多其他标志可以控制其他启发式方法,例如为ASP / DHTML内容类型创建.html。
简而言之,这取决于你想走多远。对于大多数人来说,做前两个+基本的Content-Type->名称映射就足够了。