我正在寻找一种Python魔术方法来打包那种索引列表
[0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 4, 4, 4]
,将每个索引分组到特定列表中:
[[0, 1, 2, 3, 4], [5, 6, 7], [8, 9], [10], [11, 12, 13]]
我已经使用列表推导加上一个如下所示的追加循环来完成它,但我觉得有一个Python单行程可以做到这一点。我正在处理有时会达到10000多个项目的列表,因此性能非常重要。
li = [0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 4, 4, 4]
result = [[] for _ in xrange(max(li)+1)]
for i in xrange(len(li)):
result[li[i]].append(i)
答案 0 :(得分:3)
您可以使用itertools.groupby
对值进行分组。然后根据每个组的长度计算索引,并保持该组的起始索引的运行计数。
from itertools import groupby
def index_list(l):
temp = 0
index_list = []
for key, group in groupby(l):
items = len(list(group))
index_list.append([i+temp for i in range(items)])
temp += items
return index_list
实施例
>>> l = [0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 4, 4, 4]
>>> index_list(l)
[[0, 1, 2, 3, 4], [5, 6, 7], [8, 9], [10], [11, 12, 13]]
答案 1 :(得分:2)
不确定这是否比其他答案更好,但我发现尽管如此仍然有趣:
li = [0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 4, 4, 4]
from collections import Counter
result = []
last = 0
for k,v in sorted(Counter(li).items()):
result.append(list(range(last, last + v)))
last += v
答案 2 :(得分:2)
可以使用以下表达式完成此操作:
>>> li = [0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 4, 4, 4]
>>> [[i for i, n in enumerate(li) if n == x] for x in sorted(set(li))]
[[0, 1, 2, 3, 4], [5, 6, 7], [8, 9], [10], [11, 12, 13]]
答案 3 :(得分:0)
我的实施:
li = [0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 4, 4, 4]
lout = []
lparz = []
prev = li[0]
for pos, el in enumerate(li):
if el == prev:
lparz.append(pos)
else:
lout.append(lparz)
lparz = [pos,]
prev = el
lout.append(lparz)
print lout
输出
[[0, 1, 2, 3, 4], [5, 6, 7], [8, 9], [10], [11, 12, 13]]
根据需要。