在Python多维列表中查找匹配项

时间:2011-03-22 09:33:40

标签: python multidimensional-array

我在这里疯了,我有一个截止日期。所以我在python中有这个多列表:

list_a = [[['a', 'b'],['c', 'd'], ['e', 'CB'], ['g', 'h'], ['a', 'j', 'k']]]

注意,整个事情都在2个括号中。 我需要比较这样的元素:a到c,a到d,b到c,b到d,a到e,a到CB ......直到第一个列表将所有项目与另一个项目中的所有项目进行比较列表,然后它移动到第二个列表并开始将其项目与其余列表进行比较,依此类推,直到结束。我不希望它将自己的项目与自己的列表进行比较。 这是一些代码:

for i in range(0, len(list_a)):
  for j in range(0, len(list_a)):
    for o in range (0, len(list_a[i])):
        for t in range(1, len(list_a[j])):
            try:
                for x in range(0, len(list_a[i][o])):
                    for y in range(0, len(list_a[j][t])):
                        print list_a[i][o][x], "i=",i, "o=",o, "x=",x
                        print list_a[j][t][y], "j=",j, "t=",t, "y=",y
            except IndexError:
                print ""

这个失败因为它将自己的项目与自己的项目进行比较。当然,有一种更好的方法可以做到这一点,而不是把很多forloops放在彼此里面。

而且,当我遇到CB时,我需要它向我发出信号。如果它正确循环,这将很容易。哦,那个“尝试”可以删除我猜。我确信这很容易,但我现在无法弄明白。

3 个答案:

答案 0 :(得分:5)

您可以使用itertools从列表中获取所有对,然后查找它们的所有产品:

import itertools
for l1, l2 in itertools.combinations(list_a[0], 2):
    for e1, e2 in itertools.product(l1, l2):
        print e1, e2

打印:

a c
a d
b c
b d
a e
a CB
b e
b CB
a g
a h
b g
b h
a a
a j
a k
b a
b j
b k
c e
c CB
d e
d CB
c g
c h
d g
d h
c a
c j
c k
d a
d j
d k
e g
e h
CB g
CB h
e a
e j
e k
CB a
CB j
CB k
g a
g j
g k
h a
h j
h k

答案 1 :(得分:0)

你写了

for o in range (0, len(list_a[i])):
     for t in range(1, len(list_a[j])):

o 为0时, t range(1,...)是正确的。但当 o 为1,2,3 ..那么 t 必须在range(o+1,...):,但仅限于i==j

我认为你的例子中只有一个元素[['a','b'],... ['a','j','k']]来限制执行和显示的时间,以及我想其他元素实际上也是如此。所以我测试了第二个列表作为元素,假设你想做什么样的比较。所以,我观察了索引的一些问题,你会看到以下代码中采用的解决方案。

我还更改了显示以便更轻松地分析过程。请注意“技巧”,包括渐进附加在列表 ecr 中,并在结尾显示此列表的内容。因此,显示是瞬时的而不是线后显示的长线。

list_a = [[['a', 'b'],['c', 'd'], ['e', 'CB'], ['g', 'h'], ['a', 'j', 'k']],
          [['l', 'm'],['b', 'n'], ['q', 'r'], ['CB', 'c', 'n']]]


ecr = []
for i in xrange(0, len(list_a)):
    for j in xrange(i, len(list_a)):
        ecr.append('XXXXXXXXXXXXXXXXXXX i,j='+str(i)+','+str(j))
        for o in xrange (0, len(list_a[i])-(1 if i==j else 0)):
            ecr.append('================= o='+str(o)+'  < '+str(len(list_a[i])-(1 if i==j else 0)))
            for t in xrange(o+1 if i==j else 0, len(list_a[j])):
                ecr.append('------------- o,t='+str(o)+','+str(t))
                try:
                    for x in xrange(0, len(list_a[i][o])):
                        ecr.append('~~~~~~~ x='+str(x))
                        for y in xrange(0, len(list_a[j][t])):
                            ecr.append("i,j="+str(i)+ ","+str(j)+'\n'+\
                                       list_a[i][o][x]+ "  o="+str(o)+ "  x="+str(x)+'\n'+\
                                       list_a[j][t][y]+ "  t="+str(t)+ "  y="+str(y)+'\n'+\
                                         ' ')
                except IndexError:
                    ecr.append( "FAIL")


print '\n'.join(ecr)

此代码是否符合您的目标?

答案 2 :(得分:0)

>>> list_a = [[['a', 'b'], ['c', 'd'], ['e', 'CB'], ['g', 'h'], ['a', 'j', 'k']]]

>>> k = list_a[0]

>>> c = [(a,b) for b in k for a in k if a!=b] # cartesian excluding self==self

>>> u = [(d,b) for a,b in c for d in a] # unique key, list of values

>>> f = [(a,d) for a,b in u for d in b] # final results (key,value)

>>> print "\n".join(sorted(["%s %s" % x for x in f]))
CB a
CB a
CB b
CB c
CB d
CB g
CB h
CB j
CB k
a CB
a CB
a a
a a
a b
a c
a c
a d
a d
a e
a e
a g
a g
a h
a h
a j
a k
b CB
b a
b c
b d
b e
b g
b h
b j
b k
c CB
c a
c a
c b
c e
c g
c h
c j
c k
d CB
d a
d a
d b
d e
d g
d h
d j
d k
e a
e a
e b
e c
e d
e g
e h
e j
e k
g CB
g a
g a
g b
g c
g d
g e
g j
g k
h CB
h a
h a
h b
h c
h d
h e
h j
h k
j CB
j a
j b
j c
j d
j e
j g
j h
k CB
k a
k b
k c
k d
k e
k g
k h