根据任意标准嵌套平面列表

时间:2015-05-12 17:59:03

标签: python list

我有一个独特对象的平面列表,其中一些可能与其他对象共享给定属性。我希望创建一个嵌套的列表列表,其中对象按给定属性分组。作为一个最小的例子,给出以下列表:

>>> flat = ["Shoes", "pants", "shirt", "tie", "jacket", "hat"]

我可能想按长度分组,例如:

>>> nest_by_length(flat)
[['tie', 'hat'], ['shoes', 'pants', 'shirt'], ['jacket']]

我见过几个similar questionssuggestions。但是,在所有这些情况下,嵌套都基于输入列表的顺序。在我的例子中,输入列表的排序是完全不可预测的,输出的子列表的数量和每个子列表的项目数量也是如此。

是否有标准功能或惯用方法来实现此目的?

1 个答案:

答案 0 :(得分:11)

现有列表的一个常见习惯是在itertools中使用groupby

from itertools import groupby

flat = ["Shoes", "pants", "shirt", "tie", "jacket", "hat"]

result=[]
for k, g in groupby(sorted(flat, key=len), key=len):
    result.append(list(g))

print result   

或者,更简洁:

[list(g) for _,g in groupby(sorted(flat, key=len), key=len)]

打印:

[['tie', 'hat'], ['Shoes', 'pants', 'shirt'], ['jacket']]

groupby的输入根据键函数输出的变化值分组,在本例中为len。通常,您需要根据相同的键函数对列表进行预排序,因此首先调用sorted函数。

如果您的源列表尚未完成,或者根据条件无法排序(或者您更喜欢其他选项),请创建一个将您的条件映射到唯一键值的dict:

groups={}
for e in flat:
    groups.setdefault(len(e), []).append(e)

print groups    
# {5: ['Shoes', 'pants', 'shirt'], 3: ['tie', 'hat'], 6: ['jacket']}

您还可以使用defaultdict而不是setdefault与任意键值:

from collections import defaultdict
groups=defaultdict(list)
for e in flat:
    groups[len(e)].append(e)  
# groups=defaultdict(<type 'list'>, {5: ['Shoes', 'pants', 'shirt'], 3: ['tie', 'hat'], 6: ['jacket']})

在任何一种情况下,您都可以从中创建嵌套列表:

>>> [groups[k] for k in sorted(groups.keys())] 
[['tie', 'hat'], ['Shoes', 'pants', 'shirt'], ['jacket']]