后缀数组构造

时间:2016-04-12 02:32:21

标签: java arrays suffix-array

我正在学习这个link的后缀数组构造。

这是我从c ++移植到java

的代码
class Entry  implements Comparable<Entry> {

    int [] nr = new int[2];
    int p=0;

    public int compareTo(Entry that){
        if (this.nr[0] == that.nr[0]){
            if(this.nr[1] < that.nr[1]){
                return 1;
            }else{
                return 0;
            }
        }else if(this.nr[0]<that.nr[0]){
            return 1;
        }else{
            return 0;
        }
    }
}

public class SuffixArray {

    private static final int MAXN = 65536;
    private static final int MAXLG = 17;

    private static Entry [] entries = new Entry[MAXN];
    private static int [][] matrix = new int [MAXLG] [MAXN];

    private static int step=0, count=0;
    private static int N=0;

    public static void process(String S) {

        N = S.length();
        for(int i=0;i<N;i++){
            matrix[0][i] =  (S.charAt(i)-'a');
        }
        for(int i=0;i<N;i++){
            entries[i] = new Entry();
        }

        for(step=1,count=1; (count>>1)<N;step++, count<<=1){
            for(int i=0;i<N;i++){
                entries[i].nr[0] = matrix[step-1][i];                
                entries[i].nr[1] = 
                    i + ((count<N) ? matrix[step-1][i+count] : -1) ;
                entries[i].p=i;
            }               
           Arrays.sort(entries, 0, N, new EntryComparator());
           for(int i=0;i<N;i++){
              matrix[step][entries[i].p]=i;           
              if(i>0  
                  && entries[i].nr[0]== entries[i-1].nr[0]        
                  && entries[i].nr[1]==entries[i-1].nr[1]) {
                 matrix[step][entries[i].p]= matrix[step][entries[i-1].p];
              }
           }
        }         
    }

    public static void main(String[] args) {

        String S ="mississippi";
        process(S);
    }

帖子说你可以从矩阵的最后一行获得后缀数组 但是矩阵的最后一行是什么?
对于String&#34;密西西比&#34;我总是在矩阵[N-1]看到数组为全零。
我也看不到代码中的任何错误。
有人能帮我弄清楚我错了吗?
如何从矩阵中获取后缀数组?

1 个答案:

答案 0 :(得分:0)

经过大量调试后我得到了答案。 粘贴我为找到后缀数组而编写的代码:

class Entry  implements Comparable<Entry> {

    int [] nr = new int[2];
    int p=0;

    public int compareTo(Entry that){

        if(this.nr[0] == that.nr[0]) {
            if (this.nr[1] < that.nr[1]) {
                return -1;
            } else {
                return 0;
            }
        }else if (this.nr[0] < that.nr[0] ) {
            return -1;
        } return  0;
    }

}

public class SuffixArray {

    private static final int MAXN = 65536;
    private static final int MAXLG = 17;

    private static Entry [] entries = new Entry[MAXN];
    private static int [][] matrix = new int [MAXLG] [MAXN];

    private static int step=0, count=0;
    private static int N=0;

    public static void process(String S) {

        N = S.length();
        for(int i=0;i<N;i++){
            matrix[0][i] =  (S.charAt(i)-'a');
        }

        for(int i=0;i<MAXLG;i++){
            entries[i] = new Entry();
        }

        for(step=1,count=1; (count>>1)<N;step++, count<<=1) {

            for(int i=0;i<N;i++){
                entries[i].nr[0] = matrix[step-1][i];
                entries[i].nr[1] = (i+count<N)  ? matrix[step-1][i+count] : -1 ;                 
                entries[i].p=i;
            }

            Arrays.sort(entries,0,N);

            for(int i=0;i<N;i++){
                matrix[step][entries[i].p]=i;
                if(i>0 
                    && entries[i].nr[0]== entries[i-1].nr[0] 
                    && entries[i].nr[1]==entries[i-1].nr[1]) {                     
                    matrix[step][entries[i].p]= matrix[step][entries[i-1].p];
                }
            }
        }
    }

    public static void main(String[] args) {
        String S ="banana";
        process(S);
    }
}
  

S =“香蕉”,N = len(S)= 5左

从索引0开始,矩阵中的最后一行是N = 4。

  

矩阵[4] [0 .... 5]是后缀数组

后缀数组[3,2,5,1,4,0​​]