我有一个数字列表:
Data = [0,2,0,1,2,1,0,2,0,2,0,1,2,0,2,1,1,...]
我有一个两元组的列表,这是上面各个数字的所有可能组合:
Combinations = [(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2)]
我想尝试查找组合中每个项目在数据中的显示位置,并在每次出现后将值添加到另一个列表中。
例如,对于(0,2)我想创建一个列表[0,0,0,1],因为这些是在数据中出现(0,2)之后立即下降的值。
到目前为止,我有:
any(Data[i:i+len(CurrentTuple)] == CurrentTuple for i in xrange(len(Data)-len(CurrentTuple)+1))
CurrentTuple
为Combinations.pop()
的位置。
问题是这只给了我一个关于CurrentTuple
是否出现在数据中的布尔值。我真正需要的是Data中每次出现后的值。
有没有人对如何解决这个问题有任何想法?谢谢!
答案 0 :(得分:0)
sum([all(x) for x in (Data[i:i+len(CurrentTuple)] == CurrentTuple for i in xrange
(len(Data)-len(CurrentTuple)+1))])
你做了什么返回产生以下列表的生成器:
[array([False, True], dtype=bool),
array([ True, False], dtype=bool),
array([False, True], dtype=bool),
...
array([False, False], dtype=bool),
array([False, False], dtype=bool),
array([False, False], dtype=bool),
array([False, True], dtype=bool)]
只有当数组中的CurrentTuple
都为bool
时,此列表中的一个数组才会与True
匹配。仅当列表中的所有元素都为all
时,True
才会返回True
,因此[all(x) for x in ...]
生成的列表仅包含True
匹配CurrentTuple
。当您使用True
时,1
被视为sum
。我希望很清楚。
如果您只想比较不重叠的对:
[2,2,
0,2,
...]
并保持算法尽可能通用,您可以使用以下内容:
sum([all(x) for x in (Data[i:i+len(CurrentTuple)] == CurrentTuple for i in xrange
(0,len(Data)-len(CurrentTuple)+1,len(CurrentTuple)))])
尽管更加神秘,但此代码比使用append
的任何替代方法快得多(看[Comparing list comprehensions and explicit loops (3 array generators faster than 1 for loop)了解原因)。
答案 1 :(得分:0)
您可以使用dict对数据进行分组,以查看原始列表中的梳子落在哪里/是否存在拉伸对:
it1, it2 = iter(Data), iter(Data)
next(it2)
Combinations = [(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2)]
d = {c: [] for c in Combinations}
ind = 2
for i, j in zip(it1, it2):
if (i, j) in d and ind < len(Data):
d[(i, j)].append(Data[ind])
ind += 1
print(d)
哪会给你:
{(0, 1): [2, 2], (1, 2): [1, 0], (0, 0): [], (2, 1): [0, 1], (1, 1): [2], (2, 0): [1, 2, 1, 2], (2, 2): [], (1, 0): [2], (0, 2): [0, 0, 0, 1]}
您也可以反向执行:
from collections import defaultdict
it1, it2 = iter(Data), iter(Data)
next(it2)
next_ele_dict = defaultdict(list)
data_iter = iter(Data[2:])
for ind, (i, j) in enumerate(zip(it1, it2)):
if ind < len(Data) -2:
next_ele_dict[(i, j)].append(next(data_iter))
def next_ele():
for comb in set(Combinations):
if comb in next_ele_dict:
yield comb, next_ele_dict[comb]
print(list(next_ele()))
哪会给你:
[((0, 1), [2, 2]), ((1, 2), [1, 0]), ((2, 1), [0, 1]), ((1, 1), [2]), ((2, 0), [1, 2, 1, 2]), ((1, 0), [2]), ((0, 2), [0, 0, 0, 1])]
对于组合中的每个元素,任何方法都优于传递数据列表。
要处理任意长度的元组,我们只需要根据长度创建元组:
from collections import defaultdict
n = 2
next_ele_dict = defaultdict(list)
def chunks(iterable, n):
for i in range(len(iterable)-n):
yield tuple(iterable[i:i+n])
data_iter = iter(Data[n:])
for tup in chunks(Data, n):
next_ele_dict[tup].append(next(data_iter))
def next_ele():
for comb in set(Combinations):
if comb in next_ele_dict:
yield comb, next_ele_dict[comb]
print(list(next_ele()))
您可以将它应用于您喜欢的任何实现,逻辑将与使元组相同。