poj 2406 Power Strings 后缀数组解法

时间:2022-04-16 05:19:52

连续重复子串问题

poj 2406 Power Strings

http://poj.org/problem?id=2406

问一个串能否写成a^n次方这种形式。

虽然这题用kmp做比较合适,但是我们还是用后缀数组做一做,巩固后缀数组的能力。

对于一个串,如果能写出a^n这种形式,我们可以暴力枚举循环节长度L,那么后缀suffix(1)和suffix(1 + L)的LCP应该就是 lenstr - L。如果能满足,那就是,不能,就不是。

这题的话da算法还是超时,等我学了DC3再写上来。

其实这题可以不用枚举,考虑到如果能写成a^n这种形式,那么其循环节长度必定为 lenstr - height[rank[1]]

给个图可能会更清楚

poj 2406 Power Strings 后缀数组解法

如果是循环节,那么height[rank[1]]就是第1位的排名前后的lcp,肯定是第二个循环节那里的。

然后暴力判断一下就行~dc3, 2750ms才能卡过去

#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <cmath>
#include <algorithm>
using namespace std;
#define inf (0x3f3f3f3f)
typedef long long int LL; #include <iostream>
#include <sstream>
#include <vector>
#include <set>
#include <map>
#include <queue>
#include <string>
const int maxn = * + ;
const int N = maxn;
#define F(x) ((x)/3+((x)%3==1?0:tb))
#define G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2)
int r[maxn];
int wa[maxn],wb[maxn],wv[maxn],WS[maxn];
int sa[maxn];
int c0(int *r,int a,int b) {
return r[a]==r[b]&&r[a+]==r[b+]&&r[a+]==r[b+];
}
int c12(int k,int *r,int a,int b) {
if(k==) return r[a]<r[b]||r[a]==r[b]&&c12(,r,a+,b+);
else return r[a]<r[b]||r[a]==r[b]&&wv[a+]<wv[b+];
}
void sort(int *r,int *a,int *b,int n,int m) {
int i;
for(i=; i<n; i++) wv[i]=r[a[i]];
for(i=; i<m; i++) WS[i]=;
for(i=; i<n; i++) WS[wv[i]]++;
for(i=; i<m; i++) WS[i]+=WS[i-];
for(i=n-; i>=; i--) b[--WS[wv[i]]]=a[i];
return;
}
void dc3(int *r,int *sa,int n,int m) { //涵义与DA 相同
int i,j,*rn=r+n,*san=sa+n,ta=,tb=(n+)/,tbc=,p;
r[n]=r[n+]=;
for(i=; i<n; i++) if(i%!=) wa[tbc++]=i;
sort(r+,wa,wb,tbc,m);
sort(r+,wb,wa,tbc,m);
sort(r,wa,wb,tbc,m);
for(p=,rn[F(wb[])]=,i=; i<tbc; i++)
rn[F(wb[i])]=c0(r,wb[i-],wb[i])?p-:p++;
if(p<tbc) dc3(rn,san,tbc,p);
else for(i=; i<tbc; i++) san[rn[i]]=i;
for(i=; i<tbc; i++) if(san[i]<tb) wb[ta++]=san[i]*;
if(n%==) wb[ta++]=n-;
sort(r,wb,wa,ta,m);
for(i=; i<tbc; i++) wv[wb[i]=G(san[i])]=i;
for(i=,j=,p=; i<ta && j<tbc; p++)
sa[p]=c12(wb[j]%,r,wa[i],wb[j])?wa[i++]:wb[j++];
for(; i<ta; p++) sa[p]=wa[i++];
for(; j<tbc; p++) sa[p]=wb[j++];
return;
}
int rank[maxn], height[maxn];
void calheight(int *r,int *sa,int n) { // 此处N为实际长度
int i,j,k=; // height[]的合法范围为 1-N, 其中0是结尾加入的字符
for(i=; i<=n; i++) rank[sa[i]]=i; // 根据SA求RANK
for(i=; i<n; height[rank[i++]] = k ) // 定义:h[i] = height[ rank[i] ]
for(k?k--:,j=sa[rank[i]-]; r[i+k]==r[j+k]; k++); //根据 h[i] >= h[i-1]-1 来优化计算height过程
}
char str[maxn];
void work() {
int lenstr = strlen(str);
for (int i = ; i < lenstr; ++i) r[i] = str[i];
r[lenstr] = ;
dc3(r, sa, lenstr + , );
calheight(r, sa, lenstr);
int t = lenstr - height[rank[]];
if (t == lenstr || lenstr % t != ) {
printf("1\n");
} else {
for (int i = t; i < lenstr; i += t) {
for (int j = ; j < t; ++j) {
if (str[j] != str[i + j]) {
printf("1\n");
return;
}
}
}
printf("%d\n", lenstr / t);
}
} int main() {
#ifdef local
freopen("data.txt","r",stdin);
#endif
while (scanf("%s", str) != EOF) {
if (str[] == '.') break;
work();
}
return ;
}