python垃圾收集器和列表

时间:2013-05-25 10:18:08

标签: python list garbage-collection

在Python 2.7中有关于垃圾收集的问题。为什么这段代码

class A:
    def __init__(self, name):
        self.name = name
    def __del__(self):
          print self.name,

aa = [A(str(i)) for i in range(10)]

del aa

提供输出9 8 7 6 5 4 3 2 1 0而非0 1 2 3 4 5 6 7 8 9或任何其他排列。

2 个答案:

答案 0 :(得分:5)

因为Python列表对象以相反的顺序减少了它引用的项的引用计数:

static void
list_dealloc(PyListObject *op)
{
    Py_ssize_t i;
    PyObject_GC_UnTrack(op);
    Py_TRASHCAN_SAFE_BEGIN(op)
    if (op->ob_item != NULL) {
        /* Do it backwards, for Christian Tismer.
           There's a simple test case where somehow this reduces
           thrashing when a *very* large list is created and
           immediately deleted. */
        i = Py_SIZE(op);
        while (--i >= 0) {
            Py_XDECREF(op->ob_item[i]);
        }
        PyMem_FREE(op->ob_item);
    }
    if (numfree < PyList_MAXFREELIST && PyList_CheckExact(op))
        free_list[numfree++] = op;
    else
        Py_TYPE(op)->tp_free((PyObject *)op);
    Py_TRASHCAN_SAFE_END(op)
}

看到评论;从大头开始删除引用显然会减少大型列表在某些情况下的颠簸。

我的猜测是,当您创建一个非常大的列表时,最后一项仍在缓存中,并且首先解除引用这些项有助于减少缓存流失。添加交换并从末尾开始会产生更大的差异。

答案 1 :(得分:3)

Python主要依靠引用计数来管理对象的生命周期。 (我认为它使用某种标记和扫描来处理参考周期,但不要引用我。)

我猜测,在被销毁时,会以相反的顺序列出他们的元素,因此你看到的行为。

我不认为列表元素的破坏顺序是正式定义的,在这种情况下,这不是一个“问题”。