两个列表上的操作

时间:2013-01-28 12:46:16

标签: python algorithm list

让我从一些背景开始。

假设我有这个清单:

interactions = [ ['O1', 'O3'],
               ['O2', 'O5'],
               ['O8', 'O10']
               ['P3', 'P5'],
               ['P2', 'P19'],
               ['P1', 'P6'] ]

列表中的每个条目(例如:O1, O3)是两个实体之间的交互(尽管我们在这里处理的所有内容都是字符串)。列表中有许多不同的实体。

我们还有以下列表:

similar = ['O1', 'P23'],
          ['O3', 'P50'],
          ['P2', 'O40'],
          ['P19', 'O22']

其中每个条目是两个不同实体之间的相似关系。

所以 O1 类似于 P23 O3 类似于 P50 且[O1,O3]相互作用因此,互动['P23','P50']是一种转化的互动。

同样, P2 类似于 O40 P19 类似于 O22 和[P2,P19]因此交互['O40','O22']是一种转化的互动。

转换的相互作用将始终来自相同的类型,例如:[PX,PX]或[OX,OX]。

代码

所以我编写了以下代码来生成这些关系转移:

from collections import defaultdict

interactions = [ ['O1', 'O3'],
                 ['O2', 'O5'],
                 ['O8', 'O10']
                 ['P3', 'P5'],
                 ['P2', 'P19'],
                 ['P1', 'P6'] ]

similar = [ ['O1', 'H33'],
            ['O6', 'O9'],
            ['O4', 'H1'],
            ['O2', 'H12'] ]

def list_of_lists_to_dict(list_of_lists):
  d = defaultdict(list)
  for sublist in list_of_lists:
    d[sublist[0]].append(sublist[1])
    d[sublist[1]].append(sublist[0])
  return d

interactions_dict = list_of_lists_to_dict(interactions)
similar_dict = list_of_lists_to_dict(similar)


for key, values in interactions_dict.items():
  print "{0} interacts with: {1}".format(key, ', '.join(values))
    if key in similar_dict:
      print " {0} is similar to: {1}".format(key, ', '.join(similar_dict[key]))
      forward = True
  for value in values:
    if value in similar_dict:
      print " {0} is similar to: {1}".format(value, ', '.join(similar_dict[value]))
      reverse = True
      if forward and reverse:
        print "     thus [{0}, {1}] interact!".format(', '.join(similar_dict[key]), 
         ',  '.join(similar_dict[value]))
  forward = reverse = False

我的尝试确实生成了正确的输出,但它也产生了不需要的输出。例如,有时它会在不同类型的实体之间生成输出:O1, P1,以及完全相同的实体之间:O1, O1。它还以不同的形式输出重复的结果,例如:O1, P1P1, O1 - 两者的意思相同,所以我们只想要这个条目一次。所有这些都是不受欢迎的行为。

所以我的问题是,我如何重组我解决这个问题的尝试?

感谢。

3 个答案:

答案 0 :(得分:1)

如果相似关系既不对称也不传递:

from collections import defaultdict
from itertools import product

# entity -> similar entities
d = defaultdict(list) # use `set` if `similar` has duplicate entries
for k, v in similar:
    d[k].append(v)

for a, b in interactions:
    for x, y in product(d[a], d[b]): 
       # a, b interact; a is similar to x, b is similar to y
       #note: filter undesired x, y interactions here
       print x, y # transformed interaction

答案 1 :(得分:1)

我对整体算法有一些建议:

  • 保留所有相似关系的字典,例如O1:P23和P23:O1都可以在字典中。
  • 在找到转换之前,请检查以确保交互的两个部分都可以转换,例如O1和O3必须都是字典中的键
  • 这应该可以防止任何转换被列为O和P一起,你说这是不想要的输出。
  • 如果您认为这将是一个问题,您还可以保留结果字典以检查重复项。

J.F.Sebastian的回答解决了其中一些问题,但我认为你应该注意原始字典是如何构建的,这样可以更容易地得出有意义的结果。

答案 2 :(得分:0)

如果您将列表转换为字典,则可以轻松匹配字典的键并检索这些键的值。