如何找到相对于列表在Python列表中出现位置的值?

时间:2016-09-21 17:59:25

标签: python list tuples markov-chains

我有一个数字列表:

Data = [0,2,0,1,2,1,0,2,0,2,0,1,2,0,2,1,1,...]

我有一个两元组的列表,这是上面各个数字的所有可能组合:

Combinations = [(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2)]

我想尝试查找组合中每个项目在数据中的显示位置,并在每次出现后将值添加到另一个列表中。

例如,对于(0,2)我想创建一个列表[0,0,0,1],因为这些是在数据中出现(0,2)之后立即下降的值。

到目前为止,我有:

any(Data[i:i+len(CurrentTuple)] == CurrentTuple for i in xrange(len(Data)-len(CurrentTuple)+1))

CurrentTupleCombinations.pop()的位置。 问题是这只给了我一个关于CurrentTuple是否出现在数据中的布尔值。我真正需要的是Data中每次出现后的值。

有没有人对如何解决这个问题有任何想法?谢谢!

2 个答案:

答案 0 :(得分:0)

sum([all(x) for x in (Data[i:i+len(CurrentTuple)] == CurrentTuple for i in xrange
(len(Data)-len(CurrentTuple)+1))])

你做了什么返回产生以下列表的生成器:

[array([False,  True], dtype=bool),
 array([ True, False], dtype=bool),
 array([False,  True], dtype=bool),
 ...
 array([False, False], dtype=bool),
 array([False, False], dtype=bool),
 array([False, False], dtype=bool),
 array([False,  True], dtype=bool)]

只有当数组中的CurrentTuple都为bool时,此列表中的一个数组才会与True匹配。仅当列表中的所有元素都为all时,True才会返回True,因此[all(x) for x in ...]生成的列表仅包含True匹配CurrentTuple。当您使用True时,1被视为sum。我希望很清楚。

如果您只想比较不重叠的对:

[2,2,
 0,2,
 ...]

并保持算法尽可能通用,您可以使用以下内容:

sum([all(x) for x in (Data[i:i+len(CurrentTuple)] == CurrentTuple for i in xrange
(0,len(Data)-len(CurrentTuple)+1,len(CurrentTuple)))])

尽管更加神秘,但此代码比使用append的任何替代方法快得多(看[Comparing list comprehensions and explicit loops (3 array generators faster than 1 for loop)了解原因)。

答案 1 :(得分:0)

您可以使用dict对数据进行分组,以查看原始列表中的梳子落在哪里/是否存在拉伸对:

it1, it2 = iter(Data), iter(Data)
next(it2)

Combinations = [(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2)]

d = {c: [] for c in Combinations}
ind = 2
for i, j in zip(it1, it2):
    if (i, j) in d and ind < len(Data):
        d[(i, j)].append(Data[ind])
    ind += 1
print(d)

哪会给你:

{(0, 1): [2, 2], (1, 2): [1, 0], (0, 0): [], (2, 1): [0, 1], (1, 1): [2], (2, 0): [1, 2, 1, 2], (2, 2): [], (1, 0): [2], (0, 2): [0, 0, 0, 1]}

您也可以反向执行:

from collections import defaultdict

it1, it2 = iter(Data), iter(Data)
next(it2)
next_ele_dict = defaultdict(list)
data_iter = iter(Data[2:])
for ind, (i, j) in enumerate(zip(it1, it2)):
    if ind < len(Data) -2:
      next_ele_dict[(i, j)].append(next(data_iter))

def next_ele():
    for comb in set(Combinations):
        if comb in next_ele_dict:
           yield comb, next_ele_dict[comb]

print(list(next_ele()))

哪会给你:

 [((0, 1), [2, 2]), ((1, 2), [1, 0]), ((2, 1), [0, 1]), ((1, 1), [2]), ((2, 0), [1, 2, 1, 2]), ((1, 0), [2]), ((0, 2), [0, 0, 0, 1])]

对于组合中的每个元素,任何方法都优于传递数据列表。

要处理任意长度的元组,我们只需要根据长度创建元组:

from collections import defaultdict

n = 2

next_ele_dict = defaultdict(list)

def chunks(iterable, n):
    for i in range(len(iterable)-n):
        yield tuple(iterable[i:i+n])

data_iter = iter(Data[n:])
for tup in chunks(Data, n):
      next_ele_dict[tup].append(next(data_iter))

def next_ele():
    for comb in set(Combinations):
        if comb in next_ele_dict:
            yield comb, next_ele_dict[comb]


print(list(next_ele()))

您可以将它应用于您喜欢的任何实现,逻辑将与使元组相同。