我有两个字符串,如:
a = '54515923333558964'
b = '48596478923333558964'
现在最长的后缀匹配是
c = '923333558964'
使用re的解决方案是什么?
以下是我找到的前缀匹配解决方案:
import re
pattern = re.compile("(?P<mt>\S*)\S*\s+(?P=mt)")
a = '923333221486456'
b = '923333221486234567'
c = pattern.match(a + ' ' + b).group('mt')
答案 0 :(得分:6)
import difflib
a = '54515923333558964'
b = '48596478923333558964'
s = difflib.SequenceMatcher(None, a, b)
m = s.find_longest_match(0, len(a), 0, len(b))
print a[m.a:m.a+m.size]
答案 1 :(得分:1)
您可以使用正则表达式模式的这种变体:
\S*?(?P<mt>\S*)\s+\S*(?P=mt)$
EDIT。 但请注意,这可能需要O( n 3 )时间和一些输入。尝试例如
a = 1000 * 'a'
b = 1000 * 'a' + 'b'
这需要一秒钟来处理我的系统。