我想将一对长文本与~20M字符对齐。
我在过去使用Smith-Waterman算法但是(根据我的有限理解)它需要创建一个具有文本大小的二维数组(20M乘20M数组) - 这是不实际的。
所以我正在寻找一种算法来对齐一对长文本,以保持实际的内存大小和执行时间。
更新
我也尝试过使用此实现的Myers和Miller:https://www.codeproject.com/Articles/42279/Investigating-Myers-diff-algorithm-Part-of 但是,对于“不那么大”的文本(1MB),我仍然没有内存异常。