Question

我在Python3.x中有以下词典列表：

list_of_dictionaries = [{0:3523, 1:3524, 2:3540, 4:3541, 5:3542}, 
                        {0:7245, 1:7246, 2:7247, 3:7248, 5:7249, 6:7250},
                        {1:20898, 2:20899, 3:20900, 4:20901, 5:20902}]

在这种情况下，它是包含三个词典的单个列表。

我想将其有效地合并到一个以列表作为值的字典中；这是正确的答案：

correct = {0:[3523, 7245], 1:[3524, 7246, 20898], 2:[3540, 7247, 20899], 
               3:[7248, 20900], 4:[3541, 20901], 5:[3542, 7249, 20902], 6:[7250]}

我首先想到的是这样的列表理解：

dict(pair for dictionary in list_of_dictionaries for pair in dictionary.items())

但这是错误的，因为它不包含值列表：

{0: 7245, 1: 20898, 2: 20899, 4: 20901, 5: 20902, 3: 20900, 6: 7250}

我也担心如何有效地创建价值列表。它也可能无法缩放到大型列表/大型词典。

我该怎么做？

Answer 1

`defaultdict`

您可以使用collections.defaultdict。由于您没有定义任何列表，因此无法理解字典。这可能比使用字典理解更有效，后者将涉及为每个唯一键迭代每个字典。

from collections import defaultdict

dd = defaultdict(list)

for d in list_of_dictionaries:
    for k, v in d.items():
        dd[k].append(v)

结果：

print(dd)

defaultdict(list,
            {0: [3523, 7245],
             1: [3524, 7246, 20898],
             2: [3540, 7247, 20899],
             4: [3541, 20901],
             5: [3542, 7249, 20902],
             3: [7248, 20900],
             6: [7250]})

字典理解

可能理解，但这需要计算键的并集并为每个键迭代字典列表：

allkeys = set().union(*list_of_dictionaries)

res = {k: [d[k] for d in list_of_dictionaries if k in d] for k in allkeys}

{0: [3523, 7245],
 1: [3524, 7246, 20898],
 2: [3540, 7247, 20899],
 3: [7248, 20900],
 4: [3541, 20901],
 5: [3542, 7249, 20902],
 6: [7250]}

时间复杂度

请考虑以下条款：

n = sum(map(len, list_of_dictionaries))
m = len(set().union(*list_of_dictionaries))
k = len(list_of_dictionaries)

在这种情况下，defaultdict解决方案的复杂度为O（ n ），而字典理解的复杂度为O（ mk ），其中< em> mk > = n 。

Answer 2

为什么不只使用for循环？例如：

final = {}

for i in list_of_dictionaries:
    for k in i:
        if not k in final:
            final[k] = []
        final[k].append(i[k])


print(final)

最终输出为：

{0: [3523, 7245], 1: [3524, 7246, 20898], 2: [3540, 7247, 20899], 4: [3541, 20901], 5: [3542, 7249, 20902], 3: [7248, 20900], 6: [7250]}

Answer 3

使用 groupby 和 itemgetter ，我们可以首先创建一个表示每个下级的keys and values的元组的平面列表。然后，我们可以在已排序的新列表上使用 groupby 。在这里，我们可以使用k和index[1]的{{1}}中的项目创建新字典

list(g)

Answer 4

您首先需要拼合字典：

flattened_pairs = (
    pair for dictionary in list_of_dictionaries for pair in dictionary.items()
)

然后，您可以使用itertools.groupby对值进行分组。它期望值按键排序。

key_fn = lambda pair: pair[0]

merged = {
    k: [pair[1] for pair in g]
    for k, g in groupby(
        sorted(flattened_pairs, key=key_fn),
        key=key_fn
    )
}

print(merged)

输出：

{0：[3523，7245]，1：[3524，7246，20898]，2：[3540，7247，20899]，3： [7248，20900]，4：[3541，20901]，5：[3542，7249，20902]，6：[7250]}

如何将多个字典的列表合并到列表字典中？

4 个答案:

`defaultdict`

字典理解

时间复杂度