Question

我有一个整数列表，我希望能够识别连续的重复块：也就是说，我想生成一个保留顺序的双重列表，其中每个双重包含（int_in_question，出现次数）。

例如，如果我有一个类似的列表：

[0, 0, 0, 3, 3, 2, 5, 2, 6, 6]

我希望结果是：

[(0, 3), (3, 2), (2, 1), (5, 1), (2, 1), (6, 2)]

我有一个相当的简单方法，可以使用for-loop，temp和counter来实现这个目的：

result_list = []
current = source_list[0]
count = 0
for value in source_list:
    if value == current:
        count += 1
    else:
        result_list.append((current, count))
        current = value
        count = 1
result_list.append((current, count))

但我真的很喜欢python的函数式编程习语，我希望能够通过一个简单的生成器表达式来实现。但是我发现在使用发电机时很难保留子计数。我有一种感觉，两个步骤可能会让我在那里，但现在我很难过。

有没有特别优雅/ pythonic的方式来做这件事，特别是对于发电机？

Answer 1

>>> from itertools import groupby
>>> L = [0, 0, 0, 3, 3, 2, 5, 2, 6, 6]
>>> grouped_L = [(k, sum(1 for i in g)) for k,g in groupby(L)]
>>> # Or (k, len(list(g))), but that creates an intermediate list
>>> grouped_L
[(0, 3), (3, 2), (2, 1), (5, 1), (2, 1), (6, 2)]

正如他们所说，

Batteries included。

建议使用JBernardo的sum和生成器表达式;见评论。

在列表中识别连续重复项的最Pythonic方法是什么？

1 个答案: