我有一个列表列表(“子列表”),我想查看是否有多个未指定长度的序列出现在多个子列表中。为了澄清,必须保留项目的顺序 - 我不希望每个子列表的交集作为一个集合。必须至少有2个项目按顺序匹配。 请参阅下面的示例。
输入:
someList = [[0,1,3,4,3,7,2],[2,3,4,3],[0,3,4,3,7,3]]
所需输出:(将打印到文件但不要担心此细节)
sublist0_sublist1 = [3,4,3]
第1和第2个子列表的#intersection
sublist0_sublist2 = [3,4,3,7]
#intersection of 1st and 3rd sublists
sublist1_sublist2 = [3,4,3]
#intersection of 2nd and 3rd sublists
答案 0 :(得分:1)
为你鞭打这个(包括你的评论,等长的最大子列表都应该在列表中返回):
def sublists(list1, list2):
subs = []
for i in range(len(list1)-1):
for j in range(len(list2)-1):
if list1[i]==list2[j] and list1[i+1]==list2[j+1]:
m = i+2
n = j+2
while m<len(list1) and n<len(list2) and list1[m]==list2[n]:
m += 1
n += 1
subs.append(list1[i:m])
return subs
def max_sublists(list1, list2):
subls = sublists(list1, list2)
if len(subls)==0:
return []
else:
max_len = max(len(subl) for subl in subls)
return [subl for subl in subls if len(subl)==max_len]
这适用于这些情况:
In [10]: max_sublists([0,1,3,4,3,7,2],[0,3,4,3,7,3])
Out[10]: [[3, 4, 3, 7]]
In [11]: max_sublists([0,1,2,3,0,1,3,5,2],[1,2,3,4,5,1,3,5,3,7,3])
Out[11]: [[1, 2, 3], [1, 3, 5]]
虽然它不漂亮,也不是很快。
您只需要弄清楚如何比较原始子列表中的每个子列表,但这应该很容易。
[编辑:我修复了一个错误并阻止了您的错误发生。]