是链表,数组吗?我四处搜寻,只发现有人在猜测。我的C知识不足以查看源代码。
答案 0 :(得分:195)
实际上,C代码非常简单。扩展一个宏并修剪一些不相关的注释,基本结构在listobject.h
,它将列表定义为:
typedef struct {
PyObject_HEAD
Py_ssize_t ob_size;
/* Vector of pointers to list elements. list[0] is ob_item[0], etc. */
PyObject **ob_item;
/* ob_item contains space for 'allocated' elements. The number
* currently in use is ob_size.
* Invariants:
* 0 <= ob_size <= allocated
* len(list) == ob_size
* ob_item == NULL implies ob_size == allocated == 0
*/
Py_ssize_t allocated;
} PyListObject;
PyObject_HEAD
包含引用计数和类型标识符。所以,它是一个过度分配的向量/数组。在数组填满时调整此类数组大小的代码位于listobject.c
。它实际上并没有使数组加倍,而是通过分配
new_allocated = (newsize >> 3) + (newsize < 9 ? 3 : 6);
new_allocated += newsize;
每次到容量,其中newsize
是请求的大小(不一定是allocated + 1
,因为您可以extend
使用任意数量的元素而不是append
他们一个接一个)。
另请参阅Python FAQ。
答案 1 :(得分:45)
这是一个dynamic array。实际证明:无论索引如何,索引都需要(当然,差异极小(0.0013μsecs!));
...>python -m timeit --setup="x = [None]*1000" "x[500]"
10000000 loops, best of 3: 0.0579 usec per loop
...>python -m timeit --setup="x = [None]*1000" "x[0]"
10000000 loops, best of 3: 0.0566 usec per loop
如果IronPython或Jython使用链接列表,我会感到震惊 - 它们会破坏许多广泛使用的库的性能,这些库建立在列表是动态数组的假设之上。
答案 2 :(得分:29)
在Python中,列表是指针数组。 Python的其他实现可以选择以不同的方式存储它们。
答案 3 :(得分:26)
这取决于实现,但是IIRC:
ArrayList
因此他们都有O(1)随机访问。
答案 4 :(得分:22)
Python的列表实际上是可变长度数组,而不是Lisp样式的链表。
答案 5 :(得分:20)
我建议Laurent Luce's article "Python list implementation"。对我来说真的很有用,因为作者解释了如何在CPython中实现该列表并为此目的使用优秀的图表。
列出对象C结构
CPython中的列表对象由以下C结构表示。 ob_item是列表元素的指针列表。 assigned是在内存中分配的插槽数。
typedef struct {
PyObject_VAR_HEAD
PyObject ** ob_item;
Py_ssize_t已分配;
} PyListObject;
注意分配的插槽与列表大小之间的区别非常重要。列表的大小与len(l)相同。已分配的插槽数是已在内存中分配的数量。通常,您会看到分配的大小可能大于大小。这是为了避免每次将新元素附加到列表时都需要调用realloc。
...
<强>追加强>
我们在列表中附加一个整数:l.append(1)。会发生什么?
我们继续添加一个元素:l.append(2)。使用n + 1 = 2调用list_resize,但由于分配的大小为4,因此无需分配更多内存。当我们再添加2个整数时会发生同样的事情:l.append(3),l.append(4)。下图显示了我们到目前为止所拥有的内容。
...
插入强>
...
<强>弹出强>
当你弹出最后一个元素:l.pop()时,会调用listpop()。 list_resize在listpop()内部调用,如果新大小小于分配大小的一半,则列表缩小。
你可以观察到插槽4仍然指向整数,但重要的是列表的大小现在是4。 让我们再弹出一个元素。在list_resize()中,size - 1 = 4 - 1 = 3小于分配的插槽的一半,因此列表缩小到6个插槽,列表的新大小现在为3.
...
答案 6 :(得分:5)
正如其他人所说的那样,列表(当明显很大时)通过分配固定数量的空间来实现,如果该空间应该填充,则分配更大的空间并复制元素。
要理解为什么方法是O(1)摊销,而不失一般性,假设我们已插入a = 2 ^ n个元素,我们现在必须将表加倍到2 ^(n + 1)大小。这意味着我们目前正在进行2 ^(n + 1)次操作。最后一个副本,我们做了2 ^ n个操作。在那之前我们做了2 ^(n-1)......一直到8,4,2,1。现在,如果我们将它们相加,我们得到1 + 2 + 4 + 8 + ... + 2 ^(n + 1)= 2 ^(n + 2)-1 <1。 4 * 2 ^ n = O(2 ^ n)= O(a)总插入(即O(1)摊销时间)。此外,应该注意的是,如果表格允许删除,则表格缩小必须以不同的因子进行(例如3x)
答案 7 :(得分:1)
Python中的列表类似于数组,您可以在其中存储多个值。列表是可变的,这意味着您可以更改它。您应该知道的更重要的事情是,当我们创建列表时,Python会自动为该列表变量创建reference_id。如果通过分配其他变量来更改它,则主列表将被更改。让我们尝试一个例子:
list_one = [1,2,3,4]
my_list = list_one
#my_list: [1,2,3,4]
my_list.append("new")
#my_list: [1,2,3,4,'new']
#list_one: [1,2,3,4,'new']
我们附加了my_list
,但我们的主要列表已更改。这意味着没有将列表指定为副本列表,将其指定为参考。
答案 8 :(得分:-1)
在CPython中,列表是作为动态数组实现的,因此,当我们在那时追加时,不仅会添加一个宏,还会分配更多的空间,因此每次都不应添加新的空间。