我正在查看示例后缀数组和最长公共前缀,但我不明白后缀数组的排序标准。我正在看维基百科上他们使用香蕉的例子。有人可以解释一下后缀数组是如何排序的吗? 我的第一直觉是按长度排序,但这显然不是这种情况。
(以下是他们使用的示例http://en.wikipedia.org/wiki/Suffix_array)
可以对这些后缀进行排序:
Suffix i
$ 7
a$ 6
ana$ 4
anana$ 2
banana$ 1
na$ 5
nana$ 3
答案 0 :(得分:0)
这是我在acm / icpc上的代码模板,使用DA算法
/*
rank[0...7]: 4 6 8 1 2 3 5 7
string: a a b a a a a b
-------------------------------------------
sa[1] = 3 : a a a a b height[1] = 0
sa[2] = 4 : a a a b height[2] = 3
sa[3] = 5 : a a b height[3] = 2
sa[4] = 0 : a a b a a a a b height[4] = 3
sa[5] = 6 : a b height[5] = 1
sa[6] = 1 : a b a a a a b height[6] = 2
sa[7] = 7 : b height[7] = 0
sa[8] = 2 : b a a a a b height[8] = 1
*/
const int MAXN = 200010;
int r[MAXN],sa[MAXN];
int ua[MAXN],ub[MAXN],uv[MAXN],us[MAXN];
int cmp(int *r,int a,int b,int l)
{return r[a] == r[b] && r[a+l]==r[b+l];}
void da(int *r,int *sa,int n,int m)
{
int i,j,p,*x = ua,*y = ub,*t;
for(i=0; i<m; i++) us[i] = 0;
for(i=0; i<n; i++) us[x[i] = r[i]]++;
for(i=1; i<m; i++) us[i] += us[i-1];
for(i=n-1; i>=0; i--) sa[--us[x[i]]] = i;
for(j=1,p=1; p<n; j<<=1,m=p)
{
for(p=0,i=n-j; i<n; i++) y[p++] = i;
for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0; i<n; i++) uv[i] = x[y[i]];
for(i=0; i<m; i++) us[i] = 0;
for(i=0; i<n; i++) us[uv[i]]++;
for(i=1; i<m; i++) us[i]+=us[i-1];
for(i=n-1; i>=0; i--) sa[--us[uv[i]]] = y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i<n; i++)
x[sa[i]] = cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
}
int rank[MAXN], height[MAXN];
void calh(int *r, int *sa, int n)
{
int i, j, k = 0;
for(i=1; i<=n; ++i) rank[sa[i]] = i;
for(i=0; i<n; height[rank[i++]] = k)
for(k?k--:0,j=sa[rank[i]-1]; r[i+k]==r[j+k];k++);
}
上面的时间是O(nlogn)
O(n)也有时间 您可以参考这篇文章:http://www.cs.cmu.edu/~guyb/realworld/papersS04/KaSa03.pdf
答案 1 :(得分:0)
我也很难理解后缀数组,然后我找到了这个intuition behind suffix array and how suffix array with LCP works。
希望它有所帮助!如果您需要其他解释,我会在这里提供。
答案 2 :(得分:0)
在http://discuss.codechef.com/questions/21385/a-tutorial-on-suffix-arrays
上有一个关于后缀数组的教程本教程包含什么是后缀数组?它是如何构建的?构造后缀数组的最有效方法是什么?它的用途是什么?
希望你能得到你想要的东西..