从多维列表创建字典而不复制键

时间:2016-09-04 01:34:50

标签: python dictionary defaultdict

我想要一个包含多个元素的元组列表,并将其转换为多维字典而不重复键。如果以下是我的原始列表:

myList = [('jeep', 'red', 2002, 4), ('jeep', 'red', 2003, 6), ('jeep', 'blue', 2003, 4), ('bmw', 'black', 2015, 8)]

我想采取上述内容并将其转换为这种格式的字典:

{'jeep':
    {'red': [
        [2002, 4],
        [2003, 6]]
    'blue': [
        [2003, 4]]
    },
'bmw':
    {'black': [
        [2015, 8]]
    }
}

我似乎在使用Python的默认指令走上了正确的道路,但我似乎无法完全解决这个问题。谢谢!

2 个答案:

答案 0 :(得分:4)

使用大量dict.setdefault ...

myList = [('jeep', 'red', 2002, 4), ('jeep', 'red', 2003, 6), ('jeep', 'blue', 2003, 4), ('bmw', 'black', 2015, 8)]

d = {}
for model, colour, year, month in myList:
    d.setdefault(model, {}).setdefault(colour, []).append([year, month])

对于myList中的每个项目,要么获取模型的当前字典,要么使用新的空字典创建密钥,然后使用该字典,检索该颜色的列表,或者设置密钥为新的空列表,然后将年和月作为2元素列表附加到该列表...

给你d

{'bmw': {'black': [[2015, 8]]},
 'jeep': {'blue': [[2003, 4]], 'red': [[2002, 4], [2003, 6]]}}

答案 1 :(得分:1)

由于你想要的本质上是一个具有一定数量级别的树数据结构以及叶子列表,我通过将细节封装在自定义字典子类中来更加明确它,因为它可以进行转换非常简单。

以下是应用于您的数据的数据结构的通用版本:

class TreeContainer(dict):
    def __init__(self, max_levels, leaf_factory=lambda: None, level=1):
        self.max_levels = max_levels
        self.level = level
        self.leaf_factory = leaf_factory

    def __missing__(self, key):
        if self.level < self.max_levels:  # need another level?
            value = self[key] = type(self)(self.max_levels, self.leaf_factory, 
                                           self.level+1)
        else:
            value = self[key] = self.leaf_factory()
        return value

myList = [("jeep", "red", 2002, 4), ("jeep", "red", 2003, 6),
          ("jeep", "blue", 2003, 4), ("bmw", "black", 2015, 8)]

vehicles = TreeContainer(2, list)

for model, color, year, month in myList:  # convert list to dictionary
    vehicles[model][color].append([year, month])

from pprint import pprint
pprint(vehicles)

输出:

{'bmw': {'black': [[2015, 8]]},
 'jeep': {'blue': [[2003, 4]], 'red': [[2002, 4], [2003, 6]]}}