python - 哪个数据结构用作dicts数组?

时间:2013-03-10 13:24:19

标签: python arrays list namedtuple

我需要建立一个像这样的数据结构:

{
    key: {k: v for k in range(fixed_small_number)}
    for key in range(fixed_large_number)
}

事情是我正在以“不拘一格”的方式构建它,每次获得一个项目随机k放入一个随机密钥,即我需要随机访问,我需要内部字典来是可变的。

所以我的问题分为两个:

  1. 外部字典的推荐类型。

  2. 内部字典的推荐类型。

  3. 对我来说,“最好的”解决方案是一系列可变的命名元组,只有这个不存在。

    我可以使用一个namedtuples列表,然后使用新数据重新创建每个,但这听起来非常浪费,列表不是随机访问高效的,并且所有重写都是相同的数据。

    是否有一些我不知道的神奇的新结构?

    编辑: 用法示例:

    for key, k, v in [('a', 1, 2), ('b', 1, 3), ('a', 2, 1), ('a', 3, 1), ('b', 3, 1) ...]:
        my_structre[key][k] = v
    

    EDIT2:

    事实证明,列表实际上是DO support random access

3 个答案:

答案 0 :(得分:6)

您可以使用__slots__构建自定义类来限制使用的内存量:

class MutableEfficientNamedList(object):
    __slots__ = ('field1', 'field2', 'field3')

    def __init__(self, *values):
        for k, v in zip(self.__slots__, values):
            setattr(self, k, v)

    def __getitem__(self, i):
        return getattr(self, self.__slots__[i])

    def __setitem__(self, i, v):
        return setattr(self, self.__slots__[i], v)

    def __repr__(self):
        return '{}({})'.format(type(self).__name__, 
            ', '.join(repr(getattr(self, s)) for s in self.__slots__))

然后在你的结构中使用它们。它们可以像命名元组一样使用(允许通过索引按名称访问)但它们允许变异。通过使用__slots__,每个实例的内存占用量仍然很低:

>>> menl = MutableEfficientNamedList('foo', 'bar', 'baz')
>>> menl
MutableEfficientNamedList('foo', 'bar', 'baz')
>>> menl.field1
'foo'
>>> menl[0]
'foo'
>>> menl[1]
'bar'
>>> menl[1] = 'spam'
>>> menl.field2
'spam'

你当然给插槽提供了有意义的名字,请为你的课程选择一个比我在我的例子中使用的更好的名字。 : - )

要扩展namedtuple()模式,这是一个通用工厂函数:

def namedlist(name, *attrs):
    """Create a named list class named `name` with attributes `attrs`.
       `attrs` must be strings representing valid Python identifiers.
    """
    class MutableEfficientNamedList(object):
        __slots__ = attrs

        def __init__(self, *values):
            for k, v in zip(self.__slots__, values):
                setattr(self, k, v)

        def __getitem__(self, i):
            return getattr(self, self.__slots__[i])

        def __setitem__(self, i, v):
            return setattr(self, self.__slots__[i], v)

        def __repr__(self):
            return '{}({})'.format(type(self).__name__, 
                ', '.join(repr(getattr(self, s)) for s in self.__slots__))

    MutableEfficientNamedList.__name__ = name
    return MutableEfficientNamedList

MyList = namedlist('MyList', 'foo', 'bar', 'baz')
nl = MyList(1, 2, 3)
print nl  # MyList(1, 2, 3)
print nl.bar  # 2
print nl[1]  # 2

答案 1 :(得分:2)

defaultdict感觉就在这里:

from collections import defaultdict

d = defaultdict(lambda: defaultdict(int))

d[3][4] = 10

如果您想要固定大小的列表,defaultdict可以覆盖您:

d = defaultdict(lambda: [None]*fixed_small_number)

d[3][4] = 10
# d[3] is now [None, None, None, None, 10, None, None, ...]

答案 2 :(得分:0)

鉴于你的例子:

for key, k, v in [('a', 1, 2), ('b', 1, 3), ('a', 2, 1), ('a', 3, 1), ('b', 3, 1) ...]:
    my_structre[key][k] = v

解决方案确实是使用defaultdict

from collections import defaultdict

d = defaultdict(dict)
for key, k, v in [('a', 1, 2), ('b', 1, 3), ('a', 2, 1), ('a', 3, 1), ('b', 3, 1)]:
    d[key][k] = v

答案:

{'a': {1: 2, 2: 1, 3: 1}, 'b': {1: 3, 3: 1}}

作为一项功能:

def method(iter_of_3_item_iters):
    d = defaultdict(dict)
    for (a, b, c) in iter_of_3_item_iters:
        d[a][b] = c
    return d