查找文本和模式的最长子字符串

时间:2015-03-28 22:43:04

标签: python text-processing

Python中是否有一个函数,它返回一个文本最长公共子字符串的索引和一个给定模式,以防该模式必须以这个子字符串开头?

text = Lorem ipsum dolor sit amet, consectetur adipisici elit
pattern = amegt
  
    
      

22

    
  

1 个答案:

答案 0 :(得分:1)

您正在寻找“后缀树”算法:http://en.wikipedia.org/wiki/Longest_common_substring_problem

您的解决方案应为:https://github.com/kvh/Python-Suffix-Tree

有一个关于如何使用库的例子。根据您的要求,它完全符合您的要求。

如果您需要其他帮助,请与我们联系。

干杯, 亚历