远程服务器上的文件大小通常由内容长度标头报告,但它不可靠。有时它会丢失,偶尔会被误报。我不想完全依赖此标头来确定我的代码是否应下载URL。
有没有办法在下载文件时监控文件的大小,如果超过最大大小则终止下载?
答案 0 :(得分:4)
您可以做的是读取所需的最大文件大小,然后通过再读一次来检查是否有更多字节要读取。像这样:
resp = urllib2.urlopen('http://www.google.com')
file_read = resp.read(max_wanted_size)
if resp.read(1) != '':
#file is bigger than expected code