通常情况下,我发现需要成对处理列表。我想知道哪个是pythonic和有效的方法,并在Google上找到了这个:
pairs = zip(t[::2], t[1::2])
我认为这是pythonic足够的,但在最近一次涉及idioms versus efficiency的讨论之后,我决定做一些测试:
import time
from itertools import islice, izip
def pairs_1(t):
return zip(t[::2], t[1::2])
def pairs_2(t):
return izip(t[::2], t[1::2])
def pairs_3(t):
return izip(islice(t,None,None,2), islice(t,1,None,2))
A = range(10000)
B = xrange(len(A))
def pairs_4(t):
# ignore value of t!
t = B
return izip(islice(t,None,None,2), islice(t,1,None,2))
for f in pairs_1, pairs_2, pairs_3, pairs_4:
# time the pairing
s = time.time()
for i in range(1000):
p = f(A)
t1 = time.time() - s
# time using the pairs
s = time.time()
for i in range(1000):
p = f(A)
for a, b in p:
pass
t2 = time.time() - s
print t1, t2, t2-t1
这些是我电脑上的结果:
1.48668909073 2.63187503815 1.14518594742
0.105381965637 1.35109519958 1.24571323395
0.00257992744446 1.46182489395 1.45924496651
0.00251388549805 1.70076990128 1.69825601578
如果我正确地解释它们,那应该意味着在Python中实现列表,列表索引和列表切片非常有效。这是令人安慰和意外的结果。
是否有另一种“更好”的方式成对遍历列表?
请注意,如果列表中包含奇数个元素,则最后一个元素将不在任何对中。
哪种方法可以确保包含所有元素?
我从测试的答案中添加了这两个建议:
def pairwise(t):
it = iter(t)
return izip(it, it)
def chunkwise(t, size=2):
it = iter(t)
return izip(*[it]*size)
结果如下:
0.00159502029419 1.25745987892 1.25586485863
0.00222492218018 1.23795199394 1.23572707176
大多数pythonic和非常有效:
pairs = izip(t[::2], t[1::2])
最有效率和非常pythonic:
pairs = izip(*[iter(t)]*2)
我花了一点时间才知道第一个答案使用了两个迭代器,而第二个答案使用了一个迭代器。
为了处理具有奇数个元素的序列,建议增加原始序列,添加一个与前一个元素配对的元素(None
),这可以用{{ 1}}。
请注意,在Python 3.x中,itertools.izip_longest()
的行为为zip()
,而itertools.izip()
已消失。
答案 0 :(得分:39)
我最喜欢的方式:
from itertools import izip
def pairwise(t):
it = iter(t)
return izip(it,it)
# for "pairs" of any length
def chunkwise(t, size=2):
it = iter(t)
return izip(*[it]*size)
当您想要配对所有元素时,您显然可能需要填充值:
from itertools import izip_longest
def blockwise(t, size=2, fillvalue=None):
it = iter(t)
return izip_longest(*[it]*size, fillvalue=fillvalue)
答案 1 :(得分:34)
我会说你的初始解决方案pairs = zip(t[::2], t[1::2])
是最好的,因为它最容易阅读(在Python 3中,zip
自动返回迭代器而不是列表。)
为了确保包含所有元素,您只需将列表扩展为None
。
然后,如果列表中包含奇数个元素,则最后一对将为(item, None)
。
>>> t = [1,2,3,4,5]
>>> t.append(None)
>>> zip(t[::2], t[1::2])
[(1, 2), (3, 4), (5, None)]
>>> t = [1,2,3,4,5,6]
>>> t.append(None)
>>> zip(t[::2], t[1::2])
[(1, 2), (3, 4), (5, 6)]
答案 2 :(得分:6)
我从小免责声明开始 - 请勿使用以下代码。它根本不是Pythonic,我写的只是为了好玩。它与@ THC4k pairwise
函数类似,但它使用iter
和lambda
闭包。它不使用itertools
模块,也不支持fillvalue
。我把它放在这里是因为有人可能觉得它很有趣:
pairwise = lambda t: iter((lambda f: lambda: (f(), f()))(iter(t).next), None)
答案 3 :(得分:3)
就大多数蟒蛇而言,我说recipes supplied in the python source docs(其中一些看起来很像@JochenRitzel提供的答案)可能是你最好的选择;)
def grouper(iterable, n, fillvalue=None):
"Collect data into fixed-length chunks or blocks"
# grouper('ABCDEFG', 3, 'x') --> ABC DEF Gxx
args = [iter(iterable)] * n
return izip_longest(fillvalue=fillvalue, *args)
答案 4 :(得分:2)
是否有另一种“更好”的方式成对遍历列表?
我不能肯定地说,但我对此表示怀疑:任何其他遍历都会包含更多必须解释的Python代码。像zip()这样的内置函数是用C语言编写的,速度要快得多。
哪种方法可以确保包含所有元素?
检查列表的长度,如果它是奇数(len(list) & 1 == 1
),请复制列表并附加一个项目。
答案 5 :(得分:1)
只能这样做:
>>> l = [1, 2, 3, 4, 5, 6]
>>> [(x,y) for x,y in zip(l[:-1], l[1:])]
[(1, 2), (2, 3), (3, 4), (4, 5), (5, 6)]
答案 6 :(得分:0)
>>> my_list = [1,2,3,4,5,6,7,8,9,10]
>>> my_pairs = list()
>>> while(my_list):
... a = my_list.pop(0); b = my_list.pop(0)
... my_pairs.append((a,b))
...
>>> print(my_pairs)
[(1, 2), (3, 4), (5, 6), (7, 8), (9, 10)]
答案 7 :(得分:0)
这里是使用生成器创建对/腿的示例。生成器不受堆栈限制
def pairwise(data):
zip(data[::2], data[1::2])
示例:
print(list(pairwise(range(10))))
输出:
[(0, 1), (2, 3), (4, 5), (6, 7), (8, 9)]
答案 8 :(得分:-1)
只要有人需要明智的答案算法,这里就是:
>>> def getPairs(list):
... out = []
... for i in range(len(list)-1):
... a = list.pop(0)
... for j in a:
... out.append([a, j])
... return b
>>>
>>> k = [1, 2, 3, 4]
>>> l = getPairs(k)
>>> l
[[1, 2], [1, 3], [1, 4], [2, 3], [2, 4], [3, 4]]
但是请注意,由于您在列表上使用了pop
,因此原始列表也将缩小为最后一个元素。
>>> k
[4]