例如,我们有一个这样的列表:
L = ["item1", "item2", "item3", "item3", "item3", "item1", "item2", "item4", "item4", "item4"]
我想将它们打包成以下形式的元组列表:
[("item1", 1), ("item2", 1), ("item3", 3),... ("item1", 1)]
我已经开发了一种类似的算法,以获得:
{item1: 2, item2: 2, ...}
(它会找到所有出现并计算它们,即使它们不是邻居......)
但是,我希望它只分组那些具有相同和是邻居的项目(即连续出现在一起),我怎么能做到这一点?
并不是我不知道该怎么做但我倾向于编写冗长的代码,在这种情况下我想要一个优雅而简单的解决方案。
答案 0 :(得分:5)
这也是使用itertools.groupby
(生成器版本):
from itertools import groupby
counts = ((k, sum(1 for _ in g)) for k, g in groupby(l))
>>> list(counts)
[('item1', 1),
('item2', 1),
('item3', 3),
('item1', 1),
('item2', 1),
('item4', 3)]
答案 1 :(得分:4)
使用itertools.groupby()
,重复项目,因此您可能无法将所有值存储在字典中,如item1
& item2
重复:
In [21]: l = ["item1", "item2", "item3", "item3", "item3", "item1", "item2", "item4", "item4", "item4"]
In [22]: for k,g in groupby(l):
print "{0}:{1}".format(k,len(list(g)))
....:
item1:1
item2:1
item3:3
item1:1
item2:1
item4:3
答案 2 :(得分:0)
python 3.2
from itertools import groupby
>>> [(i,(list(v)).count(i)) for i,v in groupby(L)]