字典的大小(以字节为单位)

时间:2017-07-29 20:21:51

标签: python python-2.7

如何手动计算字典的大小(它在内存中占用的字节数)。我读到最初它是280字节,第6个键增加,然后是第86个等等。我想计算当我有超过10000个键时它将占用的大小。

4 个答案:

答案 0 :(得分:8)

在这种情况下,

dictnotes.txt会有所帮助:

from sys import getsizeof

dct = {'a': 5, 'b': 7}

print(getsizeof(dct))

特别是对于词典,大小将取决于你的python版本(最近的实现已经改变)。

创建N大小字典的快捷方法是:

from itertools import zip_longest
dct = dict(zip_longest(range(N), (), fillvalue=None))
# {0: None, 1: None, 2: None, ....}

这应该有助于测试您对特定python版本的假设。

sys.getsizeof可能是相关的。

答案 1 :(得分:3)

您可以使用sys.getsizeof()进行快速检查(它将返回以字节为单位的对象大小):

>>> import sys, itertools
>>> sys.getsizeof(dict(zip(range(1), itertools.cycle([1]))))
280
>>> sys.getsizeof(dict(zip(range(5), itertools.cycle([1]))))
280
>>> sys.getsizeof(dict(zip(range(6), itertools.cycle([1]))))
1048
>>> sys.getsizeof(dict(zip(range(85), itertools.cycle([1]))))
3352
>>> sys.getsizeof(dict(zip(range(86), itertools.cycle([1]))))
12568
>>> sys.getsizeof(dict(zip(range(87), itertools.cycle([1]))))
12568
>>> sys.getsizeof(dict(zip(range(10000), itertools.cycle([1]))))
786712

如果您对Python字典的实际内部工作感兴趣,dictobject.c是最新资源({3}}用于最新的Python 3.6分支。另外,请查看here

答案 2 :(得分:2)

sys.getsizeof不适用于嵌套字典,如下面的示例所示。

>>> import sys
>>> d = { "onj1": {"name":"object 01", "id": "123"},"onj2": {"name":"object 02", "id": "124"}}
>>> d0 = {}
>>> sys.getsizeof(d0)
240
>>> sys.getsizeof(d)
240

因此找到的解决方案是此站点提供的功能:postgithub

遵循功能:

import sys

def get_size(obj, seen=None):
    """Recursively finds size of objects"""
    size = sys.getsizeof(obj)
    if seen is None:
        seen = set()
    obj_id = id(obj)
    if obj_id in seen:
        return 0
    # Important mark as seen *before* entering recursion to gracefully handle
    # self-referential objects
    seen.add(obj_id)
    if isinstance(obj, dict):
        size += sum([get_size(v, seen) for v in obj.values()])
        size += sum([get_size(k, seen) for k in obj.keys()])
    elif hasattr(obj, '__dict__'):
        size += get_size(obj.__dict__, seen)
    elif hasattr(obj, '__iter__') and not isinstance(obj, (str, bytes, bytearray)):
        size += sum([get_size(i, seen) for i in obj])
    return size

答案 3 :(得分:1)

使用sys.getsizeof获取尺寸信息