让我从一些背景开始。
假设我有这个清单:
interactions = [ ['O1', 'O3'],
['O2', 'O5'],
['O8', 'O10']
['P3', 'P5'],
['P2', 'P19'],
['P1', 'P6'] ]
列表中的每个条目(例如:O1, O3
)是两个实体之间的交互(尽管我们在这里处理的所有内容都是字符串)。列表中有许多不同的实体。
我们还有以下列表:
similar = ['O1', 'P23'],
['O3', 'P50'],
['P2', 'O40'],
['P19', 'O22']
其中每个条目是两个不同实体之间的相似关系。
所以 O1 类似于 P23 而 O3 类似于 P50 且[O1,O3]相互作用因此,互动['P23','P50']是一种转化的互动。
同样, P2 类似于 O40 , P19 类似于 O22 和[P2,P19]因此交互['O40','O22']是一种转化的互动。
转换的相互作用将始终来自相同的类型,例如:[PX,PX]或[OX,OX]。
所以我编写了以下代码来生成这些关系转移:
from collections import defaultdict
interactions = [ ['O1', 'O3'],
['O2', 'O5'],
['O8', 'O10']
['P3', 'P5'],
['P2', 'P19'],
['P1', 'P6'] ]
similar = [ ['O1', 'H33'],
['O6', 'O9'],
['O4', 'H1'],
['O2', 'H12'] ]
def list_of_lists_to_dict(list_of_lists):
d = defaultdict(list)
for sublist in list_of_lists:
d[sublist[0]].append(sublist[1])
d[sublist[1]].append(sublist[0])
return d
interactions_dict = list_of_lists_to_dict(interactions)
similar_dict = list_of_lists_to_dict(similar)
for key, values in interactions_dict.items():
print "{0} interacts with: {1}".format(key, ', '.join(values))
if key in similar_dict:
print " {0} is similar to: {1}".format(key, ', '.join(similar_dict[key]))
forward = True
for value in values:
if value in similar_dict:
print " {0} is similar to: {1}".format(value, ', '.join(similar_dict[value]))
reverse = True
if forward and reverse:
print " thus [{0}, {1}] interact!".format(', '.join(similar_dict[key]),
', '.join(similar_dict[value]))
forward = reverse = False
我的尝试确实生成了正确的输出,但它也产生了不需要的输出。例如,有时它会在不同类型的实体之间生成输出:O1, P1
,以及完全相同的实体之间:O1, O1
。它还以不同的形式输出重复的结果,例如:O1, P1
,P1, O1
- 两者的意思相同,所以我们只想要这个条目一次。所有这些都是不受欢迎的行为。
所以我的问题是,我如何重组我解决这个问题的尝试?
感谢。
答案 0 :(得分:1)
如果相似关系既不对称也不传递:
from collections import defaultdict
from itertools import product
# entity -> similar entities
d = defaultdict(list) # use `set` if `similar` has duplicate entries
for k, v in similar:
d[k].append(v)
for a, b in interactions:
for x, y in product(d[a], d[b]):
# a, b interact; a is similar to x, b is similar to y
#note: filter undesired x, y interactions here
print x, y # transformed interaction
答案 1 :(得分:1)
我对整体算法有一些建议:
J.F.Sebastian的回答解决了其中一些问题,但我认为你应该注意原始字典是如何构建的,这样可以更容易地得出有意义的结果。
答案 2 :(得分:0)
如果您将列表转换为字典,则可以轻松匹配字典的键并检索这些键的值。