我有一个加载和处理大量图像的程序:
for fn in filenames:
im = Image.open(fn)
get_some_basic_stats(im)
当在许多图像上运行时,Python进程最终会使用大量内存 - 远远超过任何一个图像应该考虑的内容。毋庸置疑,这最终会导致页面文件颠簸。
我认为(虽然我不是100%肯定,显然)这是因为之前的图像占用了内存,直到它们被垃圾收集。
有没有办法强制丢弃它们?我无法在PIL reference中找到一个。我想过使用del im
,但我知道这只会从本地范围中删除名称'im',实际上与在循环顶部重新分配它一样。
答案 0 :(得分:3)
python中的任何内容都无法显式销毁。在CPython中,所有内容都是引用计数,因此只要没有引用它就应该释放它。在你的情况下,应该在循环的下一次迭代中发生。您可以通过运行gc.collect()
强制循环垃圾收集器,但我怀疑这将解决问题。
您可以尝试:
循环结束时print sys.getrefcount(im)
。它会告诉你有多少对象引用图像。它应该是2(一个用于局部变量,一个用于im作为getrefcount的参数)。如果它更大那么就解释了为什么对象没有被解除分配。
您还可以查看gc.getobjects()
,它将返回python系统中所有对象的列表。我会编写一个快速循环来计算不同类型的对象并打印它们。看看计数是否正在上升。