Java搜索字符串(kmp)

时间:2012-04-14 18:06:48

标签: java string search knuth-morris-pratt

我想搜索字符串b中出现多少个字符串(比如说a)。 我想过实现Knuth-Morris-Pratt算法,但我更喜欢内置的java函数。有这样的功能吗?我希望函数尽可能地与最低复杂度一样,因为我多次使用它。

3 个答案:

答案 0 :(得分:2)

KMP算法不是标准Java库的一部分,但在线查找实现很容易,例如this one

答案 1 :(得分:0)

这是我做过的一个非常古老的项目的一部分。可能有助于灵感,但不确定它是否是最快的方式。

Basiclly您使用自动机功能来创建状态机表。然后,使用数学函数检查出现的情况!

Automaton Param:pattern是你正在寻找的模式,alpha是该模式中的所有caracters(例如:pattern - aabba,alpha - ab)

我对法语评论的批评!

public Automaton(String pattern, char[] alpha){

    //declaration et initialisation
    _alpha = alpha;
    _pattern = pattern;
    int m = pattern.length();
    String Pqa = "";
    String Pk = "";

    //Initialisation du Map
    for(int map = 0; map < alpha.length ; map++){
        alphaMapc.put(alpha[map],alpha[map]);
        alphaMapNum.put(alpha[map],map);
    }

    tableau = new int[pattern.length()+1][alpha.length];

    // Algo d'apres le pseduo code et les notes
    for(int q=0 ; q <= m ; q++){            
        for( int j =0 ; j <  alpha.length ;  j++  ){
            Pqa = pattern.substring(0,q );
            Pqa += alpha[j];
            int k = Math.min(m+1, q+2);

            //Do while qui test Pq avec toutes le fins possibles
            do{
                k = k-1;
                Pk = pattern.substring(0, k);

            }while( k >0 && !(Pqa.endsWith(Pk)) );

            tableau[q][j] = k;
            System.out.print(k + " "); // TEST OUTPUT
        }
        System.out.println(); // TEST OUTPUT
    }



}

public int match(String string) {

    //Initialisation de letat et du compte
    int etat = 0;
    int compte = 0;

    for(int s = 0; s < string.length() ; s++){          
        char t = string.charAt(s);      

        //Acces en O(1)
        if(t == alphaMapc.get(t)) etat = tableau[etat][alphaMapNum.get(t)];

        //Si on atteint un etat final, on recommence a l'entree de la machine et on increment le compteur
        if(etat == 15){
            etat = 0;
            compte++;
        }
    }

    //Test
    System.out.println("Compte: " + compte);
    return compte;
}

希望它有所帮助!

此致 Erwald

答案 2 :(得分:0)

在Java中,您只需使用String.indexOf()方法。

它不使用KMP算法。对于短字符串来说它足够好了,但是如果你需要性能而你打算使用大字符串那么这不是一个好的选择。

但是如果你想要一个简单的解决方案,那么它就是:

int n = 0, i = 0;
while (i < str.length() 
       && (i = str.indexOf("al", i)) != -1) {
  ++n;
  ++i;
}
System.out.println("n: " + n);

它计算子串的所有出现次数。