如何对齐长文本?

时间:2018-01-27 18:48:22

标签: algorithm text-alignment sequence-alignment

我想将一对长文本与~20M字符对齐。

我在过去使用Smith-Waterman算法但是(根据我的有限理解)它需要创建一个具有文本大小的二维数组(20M乘20M数组) - 这是不实际的。

所以我正在寻找一种算法来对齐一对长文本,以保持实际的内存大小和执行时间。

更新

我也尝试过使用此实现的Myers和Miller:https://www.codeproject.com/Articles/42279/Investigating-Myers-diff-algorithm-Part-of 但是,对于“不那么大”的文本(1MB),我仍然没有内存异常。

0 个答案:

没有答案