Knuth-Morris-Pratt算法中的前缀函数计算

时间:2015-05-23 07:11:20

标签: algorithm substring knuth-morris-pratt

所以对于以下子字符串

1 2 3 4 5 6 7 8 9 10 11

a b c d a b c d a b  x

哪个是前缀功能?我和我的一个朋友计算了它,我们有不同的结果,我的是:

a b c d a b c d a b x

0 0 0 0 1 2 3 4 5 6 2

和他的:

a b c d a b c d a b x

0 0 0 0 1 2 3 4 1 2 0

如果我错了,为什么会这样?

4 个答案:

答案 0 :(得分:1)

我在Java中的KMP函数:

public int[] KMP(String val) {
    int i = 0;
    int j = -1;
    int[] result = new int[val.length() + 1];
    result[0] = -1;
    while (i < val.length()) {
        while (j >= 0 && val.charAt(j) != val.charAt(i)) {
            j = result[j];
        }
        j++;
        i++;
        result[i] = j;
    }
    return result;

}

前缀数组的结果:

[-1, 0, 0, 0, 0, 1, 2, 3, 4, 5, 6, 0]

答案 1 :(得分:1)

你的答案都不正确。前缀函数或部分匹配表如下:

a b c d a b c d a b x

0 0 0 0 1 2 3 4 5 6 0

你的答案在索引10之前是正确的。但是在最后一个索引中你做错了什么。部分匹配表的索引11的值为0的原因是因为没有正确的前缀与字符串的任何正确后缀匹配到索引11.因为此位置的所有正确后缀将以x结尾且此位置没有正确的前缀将以x结尾。

如果您在了解实际前缀函数或部分索引表意味着什么时遇到问题,则可以查看此document。它有一个非常好的解释。希望它有所帮助。

答案 2 :(得分:1)

前缀表应为:

a b c d a b c d a b x
0 0 0 0 1 2 3 4 5 6 0

所以给出的两个版本都不对。

表格的最后一个条目

a b c d a b c d a b x
0 0 0 0 1 2 3 4 5 6 2
                    ^
                    |
                this one

要正确,a b c d a b c d a b x的{​​{1}}长度为b x的后缀也必须是长度为2的前缀,而不是a b

如果前缀表中的条目不为零,则相应的前缀和后缀已在下表中标记:

a                       0
a b                     0
a b c                   0
a b c d                 0

a  b c d a              1
-
         =
a b c d a b             2
---
        ===

a b c d a b c           3
-----
        =====

a b c d a b c d         4
-------
        =======

a b c d a b c d a       5
---------
        =========

a b c d a b c d a b     6
-----------
        ===========

a b c d a b c d a b  x   0

答案 3 :(得分:1)

你的两个答案都是错的。正确的将是

a b c d a b c d a b x

0 0 0 0 1 2 3 4 5 6 0