强制丢弃Python Imaging Library图像以回收内存

时间:2011-12-29 07:42:44

标签: python memory python-imaging-library

我有一个加载和处理大量图像的程序:

for fn in filenames:
    im = Image.open(fn)
    get_some_basic_stats(im)

当在许多图像上运行时,Python进程最终会使用大量内存 - 远远超过任何一个图像应该考虑的内容。毋庸置疑,这最终会导致页面文件颠簸。

我认为(虽然我不是100%肯定,显然)这是因为之前的图像占用了内存,直到它们被垃圾收集。

有没有办法强制丢弃它们?我无法在PIL reference中找到一个。我想过使用del im,但我知道这只会从本地范围中删除名称'im',实际上与在循环顶部重新分配它一样。

1 个答案:

答案 0 :(得分:3)

python中的任何内容都无法显式销毁。在CPython中,所有内容都是引用计数,因此只要没有引用它就应该释放它。在你的情况下,应该在循环的下一次迭代中发生。您可以通过运行gc.collect()强制循环垃圾收集器,但我怀疑这将解决问题。

您可以尝试: 循环结束时print sys.getrefcount(im)。它会告诉你有多少对象引用图像。它应该是2(一个用于局部变量,一个用于im作为getrefcount的参数)。如果它更大那么就解释了为什么对象没有被解除分配。

您还可以查看gc.getobjects(),它将返回python系统中所有对象的列表。我会编写一个快速循环来计算不同类型的对象并打印它们。看看计数是否正在上升。