用O(n)空间问题编辑距离解决方案

时间:2015-10-19 00:08:34

标签: c++ algorithm edit-distance

找到了一些不同的解决方案和调试,特别感兴趣的是下面的解决方案只需要O(n)空间,而不是存储矩阵(M * N)。但是对cur [i]的逻辑含义感到困惑。如果有人有任何意见,将非常感谢。

我发布了解决方案和代码。

Given two words word1 and word2, find the minimum number of steps required to convert word1 to word2. (each operation is counted as 1 step.)

You have the following 3 operations permitted on a word:

a) Insert a character
b) Delete a character
c) Replace a character

class Solution { 
public:
    int minDistance(string word1, string word2) {
        int m = word1.length(), n = word2.length();
        vector<int> cur(m + 1, 0);
        for (int i = 1; i <= m; i++)
            cur[i] = i;
        for (int j = 1; j <= n; j++) {
            int pre = cur[0];
            cur[0] = j;
            for (int i = 1; i <= m; i++) {
                int temp = cur[i];
                if (word1[i - 1] == word2[j - 1])
                    cur[i] = pre;
                else cur[i] = min(pre + 1, min(cur[i] + 1, cur[i - 1] + 1));
                pre = temp;
            }
        }
        return cur[m]; 
    }
}; 

1 个答案:

答案 0 :(得分:1)

您可以将cur视为编辑距离矩阵中前一行和当前行的混合。例如,考虑原始算法中的3x3矩阵。我将对每个位置进行编号,如下所示:

1 2 3
4 5 6
7 8 9

在循环中,如果您要计算位置6,则只需要235中的值。在这种情况下,cur将是以下值:

4 5 3

最后查看3?那是因为我们还没有更新它,所以它仍然有第一行的值。从上一次迭代开始,我们得到pre = 2,因为它是在我们计算5的值之前保存的。

然后,最后一个单元格的新值是pre = 2cur[i-1] = 5cur[i] = 3的最小值,正是前面提到的值。

编辑:完成类比,如果你在O(n ^ 2)版本中计算min(M[i-1][j-1], M[i][j-1], M[i-1][j]),在这个O(n)版本中你将分别计算min(pre, cur[i-1], cur[i])