我需要比较2个序列并找到编辑距离。编辑可以包括删除和插入操作(每个符号修改权重1)和块移动操作(每个符号的权重为0.1)
例如:
A B C D E F G H
F G H A B C Y D X E
Block FGH搬到这里。
是否有任何现有的算法可以有效地解决这个问题?
答案 0 :(得分:2)
您可以尝试A technique for isolating differences between files(通过here):
使用'移动'的算法 运算符在P. Heckel的描述中描述 1978 paper
(对于scribd界面很抱歉,但我猜这篇论文还没有OCR。)
答案 1 :(得分:0)
是;有许多与生物学有关的算法和理论;基因组比对和染色体重排。在不知道您的数据的情况下,很难提及更具体的内容。我提到煎饼分类作为另一种stackoverflow post的重新排列的衡量标准,还有一些其他很好的选择(压缩,特别是)。当然,该方法无法将数据拆分为块。处理小的序列数据,您应该没有问题生成所有分组。
答案 2 :(得分:0)