Question

让我从一些背景开始。

假设我有这个清单：

interactions = [ ['O1', 'O3'],
               ['O2', 'O5'],
               ['O8', 'O10']
               ['P3', 'P5'],
               ['P2', 'P19'],
               ['P1', 'P6'] ]

列表中的每个条目（例如：O1, O3）是两个实体之间的交互（尽管我们在这里处理的所有内容都是字符串）。列表中有许多不同的实体。

我们还有以下列表：

similar = ['O1', 'P23'],
          ['O3', 'P50'],
          ['P2', 'O40'],
          ['P19', 'O22']

其中每个条目是两个不同实体之间的相似关系。

所以 O1 类似于 P23 而 O3 类似于 P50 且[O1，O3]相互作用因此，互动['P23'，'P50']是一种转化的互动。

同样， P2 类似于 O40 ， P19 类似于 O22 和[P2，P19]因此交互['O40'，'O22']是一种转化的互动。

转换的相互作用将始终来自相同的类型，例如：[PX，PX]或[OX，OX]。

代码

所以我编写了以下代码来生成这些关系转移：

from collections import defaultdict

interactions = [ ['O1', 'O3'],
                 ['O2', 'O5'],
                 ['O8', 'O10']
                 ['P3', 'P5'],
                 ['P2', 'P19'],
                 ['P1', 'P6'] ]

similar = [ ['O1', 'H33'],
            ['O6', 'O9'],
            ['O4', 'H1'],
            ['O2', 'H12'] ]

def list_of_lists_to_dict(list_of_lists):
  d = defaultdict(list)
  for sublist in list_of_lists:
    d[sublist[0]].append(sublist[1])
    d[sublist[1]].append(sublist[0])
  return d

interactions_dict = list_of_lists_to_dict(interactions)
similar_dict = list_of_lists_to_dict(similar)


for key, values in interactions_dict.items():
  print "{0} interacts with: {1}".format(key, ', '.join(values))
    if key in similar_dict:
      print " {0} is similar to: {1}".format(key, ', '.join(similar_dict[key]))
      forward = True
  for value in values:
    if value in similar_dict:
      print " {0} is similar to: {1}".format(value, ', '.join(similar_dict[value]))
      reverse = True
      if forward and reverse:
        print "     thus [{0}, {1}] interact!".format(', '.join(similar_dict[key]), 
         ',  '.join(similar_dict[value]))
  forward = reverse = False

我的尝试确实生成了正确的输出，但它也产生了不需要的输出。例如，有时它会在不同类型的实体之间生成输出：O1, P1，以及完全相同的实体之间：O1, O1。它还以不同的形式输出重复的结果，例如：O1, P1，P1, O1 - 两者的意思相同，所以我们只想要这个条目一次。所有这些都是不受欢迎的行为。

所以我的问题是，我如何重组我解决这个问题的尝试？

感谢。

Answer 1

如果相似关系既不对称也不传递：

from collections import defaultdict
from itertools import product

# entity -> similar entities
d = defaultdict(list) # use `set` if `similar` has duplicate entries
for k, v in similar:
    d[k].append(v)

for a, b in interactions:
    for x, y in product(d[a], d[b]): 
       # a, b interact; a is similar to x, b is similar to y
       #note: filter undesired x, y interactions here
       print x, y # transformed interaction

Answer 2

我对整体算法有一些建议：

保留所有相似关系的字典，例如O1：P23和P23：O1都可以在字典中。
在找到转换之前，请检查以确保交互的两个部分都可以转换，例如O1和O3必须都是字典中的键
这应该可以防止任何转换被列为O和P一起，你说这是不想要的输出。
如果您认为这将是一个问题，您还可以保留结果字典以检查重复项。

J.F.Sebastian的回答解决了其中一些问题，但我认为你应该注意原始字典是如何构建的，这样可以更容易地得出有意义的结果。

Answer 3

如果您将列表转换为字典，则可以轻松匹配字典的键并检索这些键的值。

两个列表上的操作

代码

3 个答案: