拼写检查的C#LevenshteinDistance算法

时间:2013-03-22 13:21:24

标签: c# levenshtein-distance

我正在使用levenshtein算法计算两个字符串之间的差异,使用下面的代码。它目前提供了从“回答”到“目标”所需进行的更改总数,但我想将这些更改分解为正在进行的错误类型。因此将错误分类为删除,替换或插入。

我尝试添加一个简单的计数,但我是新手,并不真正理解代码是如何工作的,所以不确定如何去做。

static class LevenshteinDistance
    {
        /// <summary>
        /// Compute the distance between two strings.
        /// </summary>
        public static int Compute(string s, string t)
        {
            int n = s.Length;
            int m = t.Length;
            int[,] d = new int[n + 1, m + 1];
            // Step 1
            if (n == 0)
            {
                return m;
            }
            if (m == 0)
            {
                return n;
            }
            // Step 2
            for (int i = 0; i <= n; d[i, 0] = i++)
            {
            }
            for (int j = 0; j <= m; d[0, j] = j++)
            { 
            }
            // Step 3
            for (int i = 1; i <= n; i++)
            {

                //Step 4
                for (int j = 1; j <= m; j++)
                {
                    // Step 5
                    int cost = (t[j - 1] == s[i - 1]) ? 0 : 1;
                    // Step 6
                    d[i, j] = Math.Min(
                        Math.Min(d[i - 1, j] + 1, d[i, j - 1] + 1),
                        d[i - 1, j - 1] + cost);
                }
            }
            // Step 7
            return d[n, m];
        }
    }

提前致谢。

0 个答案:

没有答案