Question

如果可以按照以下行初始化defaultdict

，那将会很方便

d = defaultdict(list, (('a', 1), ('b', 2), ('c', 3), ('d', 4), ('a', 2),
   ('b', 3)))

生产

defaultdict(<type 'list'>, {'a': [1, 2], 'c': [3], 'b': [2, 3], 'd': [4]})

相反，我得到了

defaultdict(<type 'list'>, {'a': 2, 'c': 3, 'b': 3, 'd': 4})

为了得到我需要的东西，我最终必须这样做：

d = defaultdict(list)
for x, y in (('a', 1), ('b', 2), ('c', 3), ('d', 4), ('a', 2), ('b', 3)):
    d[x].append(y)

这是国际海事组织的一步，应该是必要的，我在这里遗漏了什么？

Answer 1

你显然缺少的是defaultdict是dict的一个简单（不是特别“神奇”）的子类。所有第一个参数都是为缺少键提供工厂函数。初始化defaultdict时，您正在初始化dict。

如果你想制作

defaultdict(<type 'list'>, {'a': [1, 2], 'c': [3], 'b': [2, 3], 'd': [4]})

您应该按照初始化其值为列表的任何其他dict的方式对其进行初始化：

d = defaultdict(list, (('a', [1, 2]), ('b', [2, 3]), ('c', [3]), ('d', [4])))

如果您的初始数据必须采用元组的形式，其第二个元素始终是整数，那么只需使用for循环。你称之为额外的一步;我称之为明确而明显的方式。

Answer 2

您描述的行为与defaultdict的其他行为不一致。看起来像你想要的FooDict那样

>>> f = FooDict()
>>> f['a'] = 1
>>> f['a'] = 2
>>> f['a']
[1, 2]

我们可以这样做，但不能用defaultdict;我们称之为AppendDict

import collections

class AppendDict(collections.MutableMapping):
    def __init__(self, container=list, append=None, pairs=()):
        self.container = collections.defaultdict(container)
        self.append = append or list.append
        for key, value in pairs:
            self[key] = value

    def __setitem__(self, key, value):
        self.append(self.container[key], value)

    def __getitem__(self, key): return self.container[key]
    def __delitem__(self, key): del self.container[key]
    def __iter__(self): return iter(self.container)
    def __len__(self): return len(self.container)

Answer 3

排序和itertools.groupby有很长的路要走：

>>> L = [('a', 1), ('b', 2), ('c', 3), ('d', 4), ('a', 2), ('b', 3)]
>>> L.sort(key=lambda t:t[0])
>>> d = defaultdict(list, [(tup[0], [t[1] for t in tup[1]]) for tup in itertools.groupby(L, key=lambda t: t[0])])
>>> d
defaultdict(<type 'list'>, {'a': [1, 2], 'c': [3], 'b': [2, 3], 'd': [4]})

使这更像是一个单行：

L = [('a', 1), ('b', 2), ('c', 3), ('d', 4), ('a', 2), ('b', 3)]
d = defaultdict(list, [(tup[0], [t[1] for t in tup[1]]) for tup in itertools.groupby(sorted(L, key=operator.itemgetter(0)), key=lambda t: t[0])])

希望这有帮助

Answer 4

我认为大部分内容都是为了避免简单的for循环而冒出很多烟雾和镜子：

di={}
for k,v in [('a', 1), ('b', 2), ('c', 3), ('d', 4), ('a', 2),('b', 3)]:
    di.setdefault(k,[]).append(v)
# di={'a': [1, 2], 'c': [3], 'b': [2, 3], 'd': [4]}

如果您的目标是一行而且您想要滥用语法而我不能支持或支持您可以使用副作用理解：

>>> li=[('a', 1), ('b', 2), ('c', 3), ('d', 4), ('a', 2),('b', 3)]
>>> di={};{di.setdefault(k[0],[]).append(k[1]) for k in li}
set([None])
>>> di
{'a': [1, 2], 'c': [3], 'b': [2, 3], 'd': [4]}

如果真的希望过度使用不可读的内容：

>>> {k1:[e for _,e in v1] for k1,v1 in {k:filter(lambda x: x[0]==k,li) for k,v in li}.items()}
{'a': [1, 2], 'c': [3], 'b': [2, 3], 'd': [4]}

你不想这样做。使用for循环Luke！

Answer 5

>>> kvs = [(1,2), (2,3), (1,3)]
>>> reduce(
...   lambda d,(k,v): d[k].append(v) or d,
...   kvs,
...   defaultdict(list))
defaultdict(<type 'list'>, {1: [2, 3], 2: [3]})

追加到列表的defaultdict的一步初始化？

5 个答案: