查找字符串中的部分子字符串

时间:2010-09-20 03:17:23

标签: algorithm string pattern-matching substring

我有两个字符串,必须进行相似性比较。必须设计算法以找到最大相似性。在这种情况下,排序很重要,但是干预(或缺失)字符则不然。由于各种原因,在这种情况下不能使用编辑距离。

情况基本如下:

string 1: ABCDEFG
string 2: AFENBCDGRDLFG

生成的算法会找到子字符串ABCDFG

我目前有一个递归解决方案,但因为必须在大量数据上运行,所以我们将非常感谢任何改进

1 个答案:

答案 0 :(得分:5)

查看您的唯一示例,您似乎希望找到最长的常见子序列。 看看LCS

  

这只是我,还是这个NP难? - David Titarenco(来自评论)

如果你想要任意数量的字符串的LCS其NP难。但它输入字符串的数量是恒定的(如本例中为2),这可以在多项式时间内完成。