我有两个字符串,必须进行相似性比较。必须设计算法以找到最大相似性。在这种情况下,排序很重要,但是干预(或缺失)字符则不然。由于各种原因,在这种情况下不能使用编辑距离。
情况基本如下:
string 1: ABCDEFG
string 2: AFENBCDGRDLFG
生成的算法会找到子字符串A
,BCD
,FG
我目前有一个递归解决方案,但因为必须在大量数据上运行,所以我们将非常感谢任何改进
答案 0 :(得分:5)
查看您的唯一示例,您似乎希望找到最长的常见子序列。 看看LCS
这只是我,还是这个NP难? - David Titarenco(来自评论)
如果你想要任意数量的字符串的LCS其NP难。但它输入字符串的数量是恒定的(如本例中为2),这可以在多项式时间内完成。