所以我要做的是将HEADER请求内容类型转换为文件扩展名。对于html页面“text / html; charset = utf-8”,典型的内容类型是这样的,这是来自python的给定响应。我已经研究过使用mimetype模块没有成功,因为它看起来不适合我正在寻找的东西。
流程:
我想将“text / html; charset = utf-8”转换为此“.html”
典型的图像内容类型是“image / jpeg”,具体取决于图像类型,但我并不太担心图像,因为大多数网址指定路径中的图像。这更适用于不以“blahahah.html”结尾的网站
我不想使用任何不在基础python库中的库。
答案 0 :(得分:9)
你可以拆分和剥离:
r = requests.get("http://stackoverflow.com/questions/29674905/convert-content-type-header-into-file-extension")
from mimetypes import guess_extension
print(guess_extension(r.headers['content-type'].partition(';')[0].strip()))
.htm