使用Python请求库下载大小

时间:2013-04-09 08:11:38

标签: python python-2.7 python-requests

我正在使用Python的请求库抓取一堆网页,但有时候爬虫会偶然发现一个绝对庞大的页面,无论是PDF还是视频还是其他庞大的文件。有没有一种方法可以限制它下载的文件的最大大小?

1 个答案:

答案 0 :(得分:2)

urlopen对象有一个方法info(),它提供了各种有用的头信息,包括Content-Length

偶尔这个设置不正确,但在大多数情况下应该会有所帮助