Java:KMP匹配算法

时间:2016-02-17 14:16:17

标签: java algorithm knuth-morris-pratt

enter image description here

我正在尝试用Java实现上述算法。但是我得到了一个超出范围的例外,我不知道如何解决这个问题。

我只是逐行翻译psuedocode。

以下是代码:

public static int[] computePrefixFunction(String input) 
    {
        int[] pi = new int[input.length()];
        int k = 0;
        for (int q = 1; q < input.length(); q++) {
            char target = input.charAt(q);
        while (k > 0 && input.charAt(k) != target) k = pi[k - 1];
        if (input.charAt(k) == target) k++;
        pi[q] = k;
    }
    return pi;
}

public static Queue<Integer> KMPMatcher(String T, String P) 
{
    int n = T.length();
    int m = P.length();
    int[] pi = computePrefixFunction(P);
    int q = 0;
    Queue<Integer> Q = new LinkedList<>();
    for(int i = 0; i < n; i++) 
    {
        while(q > 0 && P.charAt(q+1) != T.charAt(i)) 
            q = pi[q];
        if(P.charAt(q+1) == T.charAt(i)) 
            q = q + 1;
        if(q == m-1) // you match it when q reaches size of pattern -1. :)
        {
            Q.add(i-m+1); // Change it as well.
            q = pi[q];
        }     
    }
    return Q;
}

public static void main(String[] args) {
    System.out.println(KMPMatcher("bdacabdacb","bda"));
}

编辑:我已经使用下面的piyush实现更新了代码,这纠正了我的一些问题。但是还有另一个问题。

我使用以下方法测试了KMPMatcher:

1)System.out.println(KMPMatcher("bacabab","bab")); // returned [2,4]

2)System.out.println(KMPMatcher("bdacabdacb","bab")); // returned [3]

数字1应该只返回4而数字2应该只返回一个空列表。为什么会这样?我试图用这些输入绘制跟踪并将其与伪代码进行比较。我认为它与if(q==m-1)中的索引有关(因为它没有比较与psuedocode版本相比正确的东西?)而且我不确定如何修复它。有什么帮助吗?

1 个答案:

答案 0 :(得分:3)

问题出在if声明中。它不应该是if (q == m-1)

public static int[] computePrefixFunction(String input) 
    {
        int[] pi = new int[input.length()];
        int k = 0;
        for (int q = 1; q < input.length(); q++) {
            char target = input.charAt(q);
        while (k > 0 && input.charAt(k) != target) k = pi[k - 1];
        if (input.charAt(k) == target) k++;
        pi[q] = k;
    }
    return pi;
}

   public static Queue<Integer> KMPMatcher(String T, String P) 
{
    int n = T.length();
    int m = P.length();
    int[] pi = computePrefixFunction(P);
    int q = 0;
    Queue<Integer> Q = new LinkedList<>();
    for(int i = 0; i < n; i++) 
    {
        while(q > 0 && P.charAt(q) != T.charAt(i)) 
            q = pi[q-1];
        if(P.charAt(q) == T.charAt(i)) 
            q++;
        {
            Q.add(i-q+1); // Change it.
            q = pi[q-1];
        }     
    }
    return Q;
}

public static void main(String[] args) {
    System.out.println(KMPMatcher("bdacabdacb","bda"));
}