Question

是链表，数组吗？我四处搜寻，只发现有人在猜测。我的C知识不足以查看源代码。

Answer 1

实际上，C代码非常简单。扩展一个宏并修剪一些不相关的注释，基本结构在listobject.h，它将列表定义为：

typedef struct {
    PyObject_HEAD
    Py_ssize_t ob_size;

    /* Vector of pointers to list elements.  list[0] is ob_item[0], etc. */
    PyObject **ob_item;

    /* ob_item contains space for 'allocated' elements.  The number
     * currently in use is ob_size.
     * Invariants:
     *     0 <= ob_size <= allocated
     *     len(list) == ob_size
     *     ob_item == NULL implies ob_size == allocated == 0
     */
    Py_ssize_t allocated;
} PyListObject;

PyObject_HEAD包含引用计数和类型标识符。所以，它是一个过度分配的向量/数组。在数组填满时调整此类数组大小的代码位于listobject.c。它实际上并没有使数组加倍，而是通过分配

来增长

new_allocated = (newsize >> 3) + (newsize < 9 ? 3 : 6);
new_allocated += newsize;

每次

到容量，其中newsize是请求的大小（不一定是allocated + 1，因为您可以extend使用任意数量的元素而不是append他们一个接一个）。

另请参阅Python FAQ。

Answer 2

这是一个dynamic array。实际证明：无论索引如何，索引都需要（当然，差异极小（0.0013μsecs！））;

...>python -m timeit --setup="x = [None]*1000" "x[500]"
10000000 loops, best of 3: 0.0579 usec per loop

...>python -m timeit --setup="x = [None]*1000" "x[0]"
10000000 loops, best of 3: 0.0566 usec per loop

如果IronPython或Jython使用链接列表，我会感到震惊 - 它们会破坏许多广泛使用的库的性能，这些库建立在列表是动态数组的假设之上。

Answer 3

在Python中，列表是指针数组。 Python的其他实现可以选择以不同的方式存储它们。

Answer 4

这取决于实现，但是IIRC：

CPython使用指针数组
Jython使用ArrayList
IronPython显然也使用了一个数组。您可以浏览source code以查找。

因此他们都有O（1）随机访问。

Answer 5

根据documentation，

Python的列表实际上是可变长度数组，而不是Lisp样式的链表。

Answer 6

我建议Laurent Luce's article "Python list implementation"。对我来说真的很有用，因为作者解释了如何在CPython中实现该列表并为此目的使用优秀的图表。

列出对象C结构

CPython中的列表对象由以下C结构表示。 ob_item是列表元素的指针列表。 assigned是在内存中分配的插槽数。

typedef struct {

PyObject_VAR_HEAD

PyObject ** ob_item;

Py_ssize_t已分配;

} PyListObject;

注意分配的插槽与列表大小之间的区别非常重要。列表的大小与len（l）相同。已分配的插槽数是已在内存中分配的数量。通常，您会看到分配的大小可能大于大小。这是为了避免每次将新元素附加到列表时都需要调用realloc。

...

<强>追加

我们在列表中附加一个整数：l.append（1）。会发生什么？

我们继续添加一个元素：l.append（2）。使用n + 1 = 2调用list_resize，但由于分配的大小为4，因此无需分配更多内存。当我们再添加2个整数时会发生同样的事情：l.append（3），l.append（4）。下图显示了我们到目前为止所拥有的内容。

...

插入

让我们在位置1处插入一个新的整数（5）：l.insert（1,5）并查看内部发生的事情。

...


<强>弹出

当你弹出最后一个元素：l.pop（）时，会调用listpop（）。 list_resize在listpop（）内部调用，如果新大小小于分配大小的一半，则列表缩小。

你可以观察到插槽4仍然指向整数，但重要的是列表的大小现在是4。   让我们再弹出一个元素。在list_resize（）中，size - 1 = 4 - 1 = 3小于分配的插槽的一半，因此列表缩小到6个插槽，列表的新大小现在为3.

你可以观察到插槽3和4仍然指向一些整数，但重要的是列表的大小现在为3。

...


删除   Python列表对象有一个删除特定元素的方法：l.remove（5）。

Answer 7

正如其他人所说的那样，列表（当明显很大时）通过分配固定数量的空间来实现，如果该空间应该填充，则分配更大的空间并复制元素。

要理解为什么方法是O（1）摊销，而不失一般性，假设我们已插入a = 2 ^ n个元素，我们现在必须将表加倍到2 ^（n + 1）大小。这意味着我们目前正在进行2 ^（n + 1）次操作。最后一个副本，我们做了2 ^ n个操作。在那之前我们做了2 ^（n-1）......一直到8,4,2,1。现在，如果我们将它们相加，我们得到1 + 2 + 4 + 8 + ... + 2 ^（n + 1）= 2 ^（n + 2）-1 <1。 4 * 2 ^ n = O（2 ^ n）= O（a）总插入（即O（1）摊销时间）。此外，应该注意的是，如果表格允许删除，则表格缩小必须以不同的因子进行（例如3x）

Answer 8

Python中的列表类似于数组，您可以在其中存储多个值。列表是可变的，这意味着您可以更改它。您应该知道的更重要的事情是，当我们创建列表时，Python会自动为该列表变量创建reference_id。如果通过分配其他变量来更改它，则主列表将被更改。让我们尝试一个例子：

list_one = [1,2,3,4]

my_list = list_one

#my_list: [1,2,3,4]

my_list.append("new")

#my_list: [1,2,3,4,'new']
#list_one: [1,2,3,4,'new']

我们附加了my_list，但我们的主要列表已更改。这意味着没有将列表指定为副本列表，将其指定为参考。

Answer 9

在CPython中，列表是作为动态数组实现的，因此，当我们在那时追加时，不仅会添加一个宏，还会分配更多的空间，因此每次都不应添加新的空间。

Python的列表是如何实现的？

9 个答案: