Question

观察以下内容（在Python第2.7.3节中）：

>>> import sys
>>> sys.getsizeof(1)
24

>>> sys.getsizeof(10000)
24

为什么较大的整数只占用较小整数的相同内存量（堆的内存为afaik）？

比较以下

>>> sys.getsizeof("1")
38 

>>> sys.getsizeof("100000")
42

Answer 1

如果执行sys.getsizeof("1") vs sys.getsizeof("100000")，则较大的字符串会占用更多内存。那为什么整数会有所不同呢？

因为整数不是逐个字符存储的。

在Python中，整数的开始与平台的本机字一样大（加上解释器内部簿记所需的额外空间），因为算术速度更快 - 如果使用本机类型，处理器可以直接对它们进行算术运算。

当你超出本机字边界（在32位机器上的-2 ** 31 - （2 ** 31-1））时，Python会自动切换到任意精度算术，其中操作被模拟＆＃34; ;在软件中（当然建立在硬件提供的通常基元上）。

这仍然不会给你一个类似字符串的＆＃34;增加，因为更大的块中使用的空间增加（再次，通常出于效率原因）。

此外，寻找1：1十进制数字 - 整数大小关系会产生误导，因为整数存储在二进制中，十进制数字＆＃34;采用＆＃34; ~3.32二进制数字;所以，大小＆＃34;跳跃＆＃34;不会在＆＃34;十进制数字＆＃34;边界，但更多的是两个边界的力量。

Answer 2

字符串和整数确实具有可比性，因为它们可以被视为一个任意长的数字＆＃34;数字＆＃34;或＆＃34;字符＆＃34;。当你使用足够大的整数（如2 ^ 70,5e100，......）时，将看到内存使用率上升¹。当你添加一个＆＃34;字符＆＃34; /＆＃34;数字＆＃34;无论如何，内存使用率都会上升。对于字符串，一个＆＃34;字符＆＃34;大概是你所期望的（unicode变得更复杂，但无论如何）。

然而，对于整数，一个＆＃34;数字＆＃34;非常大：几十位（而不是一个十进制数字，更不用说一位）。这部分是因为内存被分为比特和比特组（而不是十进制数字），部分是你不能分配单个比特（最多单个字节，但即便这样也是浪费），部分原因是因为它是对CPU可以工作的那么多位更有效。本地＆＃34; （通常为4到8个字节），部分是为了简化代码。

Python 2有两种整数类型int和long的额外复杂性。在上述解释的上下文中，int是一个奇怪的例外，因为它们允许您使用更大的单个数字（例如64位而不是30位），但只有数字符合该单个数字。一般原则仍然适用。

¹虽然这些整数将包含long类，而不是int。

sys.getsizeof（1）和sys.getsizeof（10000）返回相同的输出。为什么？

2 个答案: