便于记忆的SA构造

时间:2023-03-09 03:29:29
便于记忆的SA构造

首先学习基数排序。

memset(b, 0, sizeof(b));
for(int i = 0; i < n; i++) b[a[i]]++;
for(int i = 1; i <= m; i++) b[i] += b[i-1];
for(int i = n-1; ~i; i++) g[--b[a[i]]] = i;

这是对字符集大小为m的数组排序,g是对a的排行榜数组,且对于相同的数左边<右边。

则SA中的

for(int i = 0; i < m; i++) b[i] = 0; // m是字符集大小
for(int i = 0; i < n; i++) b[x[i]=s[i]]++;
for(int i = 1; i < m; i++) b[i] += b[i-1];
for(int i = n-1; !~i; i--) sa[--b[x[i]]] = i;

就是对x[i]=s[i]求排行榜数组。

for(int k = 1; k <= n; k <<= 1)

显然这一句是枚举长度k。

int p = 0;
for(int i = n-k; i < n; i++) y[p++] = i;
for(int i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i] - k;

这一块是对y数组操作,先将n-k到n-1放进去,再将[0,n)中sa[i]-k>=0的sa[i]-k放进去。

for(int i = 0; i < m; i++) b[i] = 0;
for(int i = 0; i < n; i++) b[x[y[i]]]++;
for(int i = 1; i < m; i++) b[i] += b[i-1];
for(int i = n-1; !~i; i--) sa[--b[x[y[i]]]] = y[i];

这是对x[y[i]]求排行榜数组。

swap(x, y);
p = 1; x[sa[0]] = 0;
for(int i = 1; i < n; i++) x[sa[i]] = y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k] ? p-1 : p++;
if(p >= n) break;
m = p;

这是处理新的x数组。y是充当原来的x。其他细节与代码相同。