我有一个如下列表:
l = [0,0,0,0,0,0,1,1,1,1,1,1,0,0,0,0,2,2,2]
我想确定一系列相等项的长度,即对于给定的列表,我希望输出为:
[(0, 6), (1, 6), (0, 4), (2, 3)]
(或类似的格式)。
我考虑使用defaultdict
,但它会计算每个项目的出现次数,并为整个列表累积它,因为我不能有多个键“0”。
现在,我的解决方案如下:
out = []
cnt = 0
last_x = l[0]
for x in l:
if x == last_x:
cnt += 1
else:
out.append((last_x, cnt))
cnt = 1
last_x = x
out.append((last_x, cnt))
print out
我想知道是否有更多的pythonic方法可以做到这一点。
答案 0 :(得分:14)
您几乎肯定想使用itertools.groupby:
l = [0,0,0,0,0,0,1,1,1,1,1,1,0,0,0,0,2,2,2]
answer = []
for key, iter in itertools.groupby(l):
answer.append((key, len(list(iter))))
# answer is [(0, 6), (1, 6), (0, 4), (2, 3)]
如果您想提高内存效率,增加更多复杂性,可以添加长度函数:
def length(l):
if hasattr(l, '__len__'):
return len(l)
else:
i = 0
for _ in l:
i += 1
return i
l = [0,0,0,0,0,0,1,1,1,1,1,1,0,0,0,0,2,2,2]
answer = []
for key, iter in itertools.groupby(l):
answer.append((key, length(iter)))
# answer is [(0, 6), (1, 6), (0, 4), (2, 3)]
请注意,虽然我没有对length()函数进行基准测试,但它很可能会减慢你的速度。
答案 1 :(得分:3)
迈克的答案很好,但是groupby返回的itertools._grouper
将永远不会有__len__
方法,所以没有针对它进行测试
我使用sum(1 for _ in i)
来获取itertools._grouper的长度
>>> import itertools as it
>>> L = [0,0,0,0,0,0,1,1,1,1,1,1,0,0,0,0,2,2,2]
>>> [(k, sum(1 for _ in i)) for k, i in it.groupby(L)]
[(0, 6), (1, 6), (0, 4), (2, 3)]