在python

时间:2015-08-31 18:58:28

标签: python

我想在两个列表中找到所有常见序列。 例如:

list1 = [1,2,3,4,5,6,7,8,9]
list2 = [1,2,7,8,9,5,7,5,6]

我希望输出为:

matched_list = [[1,2],[7,8,9],[5,6]]

我的代码如下:

import difflib
def matches(first_string,second_string):
    s = difflib.SequenceMatcher(None, first_string,second_string)
    match = [first_string[i:i+n] for i, j, n in s.get_matching_blocks() if n > 0]
    return match

但我得到的输出为:

match = [[1,2] ,[7,8,9]]

1 个答案:

答案 0 :(得分:2)

如果输出顺序不重要,多通道解决方案可以解决问题。每次找到匹配项时,都要从列表/字符串中删除子字符串/子列表。

<强>实施

def matches(list1, list2):
    while True:
        mbs = difflib.SequenceMatcher(None, list1, list2).get_matching_blocks()
        if len(mbs) == 1: break
        for i, j, n in mbs[::-1]:
            if n > 0: yield list1[i: i + n]
            del list1[i: i + n]
            del list2[j: j + n]

示例输出

>>> list(matches(list1, list2))
[[7, 8, 9], [1, 2], [5, 6]]