New Distinct Substrings

spoj705:http://www.spoj.com/problems/SUBST1/
题意：和spoj694一样，只是数据范围变大了。
题解：同spoj694.
 #include<iostream>

 #include<cstdio>

 #include<cstring>

 using namespace std;

 const int maxn=;

 char str[maxn];

 int wa[maxn],wb[maxn],wv[maxn],wn[maxn],a[maxn],sa[maxn];

 int cmp(int* r,int a,int b,int l)

 {

     return r[a]==r[b]&&r[a+l]==r[b+l];

 }

 //n为字符串长度，m为字符的取值范围，r为字符串。后面的j为每次排序时子串的长度

 void DA(int* r,int* sa,int n,int m)

 {

     int i,j,p,*x=wa,*y=wb,*t;

     ///对R中长度为1的子串进行基数排序

     for(i=; i<m; i++)wn[i]=;

     for(i=; i<n; i++)wn[x[i]=r[i]]++;

     for(i=; i<m; i++)wn[i]+=wn[i-];

     for(i=n-; i>=; i--)sa[--wn[x[i]]]=i;

     for(j=,p=; p<n; j*=,m=p)

     {

         //利用了上一次基数排序的结果，对待排序的子串的第二关键字进行了一次高效地基数排序

         for(p=,i=n-j; i<n; i++)y[p++]=i;

         for(i=; i<n; i++)if(sa[i]>=j)y[p++]=sa[i]-j;

         ///基数排序

         for(i=; i<n; i++)wv[i]=x[y[i]];

         for(i=; i<m; i++)wn[i]=;

         for(i=; i<n; i++)wn[wv[i]]++;

         for(i=; i<m; i++)wn[i]+=wn[i-];

         for(i=n-; i>=; i--)sa[--wn[wv[i]]]=y[i];

         ///当p=n的时候，说明所有串都已经排好序了

         ///在第一次排序以后，rank数组中的最大值小于p，所以让m=p

         for(t=x,x=y,y=t,p=,x[sa[]]=,i=; i<n; i++)

             x[sa[i]]=cmp(y,sa[i-],sa[i],j)?p-:p++;

     }

     return;

 }

 ///后缀数组  计算height数组

 /**

 height数组的值应该是从height[1]开始的，而且height[1]应该是等于0的。

 原因是，+因为我们在字符串后面添加了一个0号字符，所以它必然是最小的

 一个后缀。而字符串中的其他字符都应该是大于0的（前面有提到，使用倍

 增算法前需要确保这点），所以排名第二的字符串和0号字符的公共前缀

 （即height[1]）应当为0.在调用calheight函数时，要注意height数组的范

 围应该是[1..n]。所以调用时应该是calheight(r,sa,n)

 而不是calheight(r,sa,n+1)。*/

 int rank[maxn],height[maxn];

 void calheight(int* r,int* sa,int n)

 {

     int i,j,k=;

     for(i=; i<=n; i++)rank[sa[i]]=i;

     for(i=; i<n; height[rank[i++]]=k)

         for(k?k--:,j=sa[rank[i]-]; r[i+k]==r[j+k]; k++);

     return;

 }

 int main()

 {

     int t;

     scanf("%d",&t);

     while(t--)

     {

         char str[];

         scanf("%s",str);

         int n=strlen(str);

         for(int i=;i<n;i++) a[i]=(int)str[i];

         a[n]=;

         DA(a,sa,n+,);

         calheight(a,sa,n);

         int sum=;

         for(int i=;i<=n;i++)

         sum+=n-sa[i]-height[i];

         printf("%d\n",sum);

     }

     return ;

 }
秒客网

New Distinct Substrings

相关文章