Question

远程服务器上的文件大小通常由内容长度标头报告，但它不可靠。有时它会丢失，偶尔会被误报。我不想完全依赖此标头来确定我的代码是否应下载URL。

有没有办法在下载文件时监控文件的大小，如果超过最大大小则终止下载？

Answer 1

您可以做的是读取所需的最大文件大小，然后通过再读一次来检查是否有更多字节要读取。像这样：

resp = urllib2.urlopen('http://www.google.com')
file_read = resp.read(max_wanted_size)
if resp.read(1) != '':
    #file is bigger than expected code