在Python中,如何获得两个列表的交集,保留交集的顺序?

时间:2013-05-16 16:34:45

标签: python sequence intersection preserve

我有一个列表列表(“子列表”),我想查看是否有多个未指定长度的序列出现在多个子列表中。为了澄清,必须保留项目的顺序 - 我不希望每个子列表的交集作为一个集合。必须至少有2个项目按顺序匹配。 请参阅下面的示例。

输入:

someList = [[0,1,3,4,3,7,2],[2,3,4,3],[0,3,4,3,7,3]]

所需输出:(将打印到文件但不要担心此细节)

sublist0_sublist1 = [3,4,3]第1和第2个子列表的#intersection

sublist0_sublist2 = [3,4,3,7] #intersection of 1st and 3rd sublists

sublist1_sublist2 = [3,4,3] #intersection of 2nd and 3rd sublists

1 个答案:

答案 0 :(得分:1)

为你鞭打这个(包括你的评论,等长的最大子列表都应该在列表中返回):

def sublists(list1, list2):
    subs = []
    for i in range(len(list1)-1):
        for j in range(len(list2)-1):
            if list1[i]==list2[j] and list1[i+1]==list2[j+1]:
                m = i+2
                n = j+2
                while m<len(list1) and n<len(list2) and list1[m]==list2[n]:
                    m += 1
                    n += 1
                subs.append(list1[i:m])
    return subs

def max_sublists(list1, list2):
    subls = sublists(list1, list2)
    if len(subls)==0:
        return []
    else:
        max_len = max(len(subl) for subl in subls)
        return [subl for subl in subls if len(subl)==max_len]

这适用于这些情况:

In [10]: max_sublists([0,1,3,4,3,7,2],[0,3,4,3,7,3])
Out[10]: [[3, 4, 3, 7]]
In [11]: max_sublists([0,1,2,3,0,1,3,5,2],[1,2,3,4,5,1,3,5,3,7,3])
Out[11]: [[1, 2, 3], [1, 3, 5]]

虽然它不漂亮,也不是很快。

您只需要弄清楚如何比较原始子列表中的每个子列表,但这应该很容易。

[编辑:我修复了一个错误并阻止了您的错误发生。]