使用python请求获取HTML页面的内容取决于Content-Type?

时间:2017-10-08 18:35:38

标签: python-3.x python-requests

使用Python请求库,有没有办法获取HTTP响应头,只有当Content-Type头是某种特定类型时才通过网络获取正文?

我当然可以发出HEAD请求,检查Content-Type,如果类型匹配,则发出GET请求。但有没有办法避免两次获取HTTP标头?

1 个答案:

答案 0 :(得分:0)

我选择requests.head(),检查内容类型,如果类型是应该提取的内容,请执行requests.get()以获取正文。

通过不提取其他内容类型的主体,两次获取标题的额外网络I / O超过了。