BZOJ3145 : [Feyat cup 1.5]Str

时间:2023-03-08 21:59:42
BZOJ3145 : [Feyat cup 1.5]Str

如果不存在模糊点,那么答案就是两个串的最长公共子串。

如果模糊点是某个串的开头或者结尾,那么可以暴力枚举另一个串中的某个前后缀更新答案。

否则,假设模糊点在第一个串里是$i$,在第二个串里是$j$,那么此时对答案的贡献为$lcp(i+1,j+1)+lcs(i-1,j-1)+1$。

将两个串用特殊字符拼接,求出正串的后缀数组以及反串的后缀数组,那么$lcp(i+1,j+1)+lcs(i-1,j-1)+1$等价于两个height数组的区间最小值的和。

考虑从大到小枚举第一个数,每次把所有大于等于它的部分全部合并,那么在另一个数组里显然只有相邻的后缀有用。

所以对于每个集合建立两棵平衡树,维护两个串在反串里的rank。

在启发式合并的时候,只需要在另一个串对应的平衡树里找到前驱后继然后更新答案即可。

时间复杂度$O(n\log^2n)$。

#include<cstdio>
#include<algorithm>
#include<cstring>
#include<set>
using namespace std;
const int N=400010,M=200005;
char sa[N],sb[N],s[N];int na,nb,n,i,j,Log[N],ans;
struct DS{
char s[N];
int rk[N],sa[N],height[N],tmp[N],cnt[N],f[18][M];
void suffixarray(int n,int m){
int i,j,k;n++;
for(i=0;i<n*2+5;i++)rk[i]=sa[i]=height[i]=tmp[i]=0;
for(i=0;i<m;i++)cnt[i]=0;
for(i=0;i<n;i++)cnt[rk[i]=s[i]]++;
for(i=1;i<m;i++)cnt[i]+=cnt[i-1];
for(i=0;i<n;i++)sa[--cnt[rk[i]]]=i;
for(k=1;k<=n;k<<=1){
for(i=0;i<n;i++){
j=sa[i]-k;
if(j<0)j+=n;
tmp[cnt[rk[j]]++]=j;
}
sa[tmp[cnt[0]=0]]=j=0;
for(i=1;i<n;i++){
if(rk[tmp[i]]!=rk[tmp[i-1]]||rk[tmp[i]+k]!=rk[tmp[i-1]+k])cnt[++j]=i;
sa[tmp[i]]=j;
}
memcpy(rk,sa,n*sizeof(int));
memcpy(sa,tmp,n*sizeof(int));
if(j>=n-1)break;
}
for(j=rk[height[i=k=0]=0];i<n-1;i++,k++)
while(~k&&s[i]!=s[sa[j-1]+k])height[j]=k--,j=rk[sa[j]+1];
}
void build(){
int i,j;
for(i=1;i<=n;i++)f[0][i]=height[i];
for(j=1;j<18;j++)for(i=1;i+(1<<j-1)<=n;i++)f[j][i]=min(f[j-1][i],f[j-1][i+(1<<j-1)]);
}
inline int ask(int x,int y){
int k=Log[y-x+1];
return min(f[k][x],f[k][y-(1<<k)+1]);
}
inline int lcp(int x,int y){
if(x>y)swap(x,y);
return ask(x+1,y);
}
}A,B;
int q[M],f[M],ca[M],cb[M],size[M],g[M],v[M<<1],nxt[M<<1],ed,lcp;
set<int>TA[M],TB[M];
inline bool cmp(int x,int y){return A.height[x]>A.height[y];}
inline void add(int x,int y){v[++ed]=y;nxt[ed]=g[x];g[x]=ed;}
void dfs(int x,int y,int z){
f[x]=z;
if(A.sa[x]<na){
int j=A.sa[x]-2;
if(j>=0){
j=B.rk[n-1-j];
TA[z].insert(j);
set<int>::iterator k=TB[z].lower_bound(j);
if(k!=TB[z].end())ans=max(ans,lcp+B.lcp(j,*k));
if(k!=TB[z].begin())k--,ans=max(ans,lcp+B.lcp(j,*k));
}
}
if(A.sa[x]>na){
int j=A.sa[x]-2;
if(j>na){
j=B.rk[n-1-j];
TB[z].insert(j);
set<int>::iterator k=TA[z].lower_bound(j);
if(k!=TA[z].end())ans=max(ans,lcp+B.lcp(j,*k));
if(k!=TA[z].begin())k--,ans=max(ans,lcp+B.lcp(j,*k));
}
}
for(int i=g[x];i;i=nxt[i])if(v[i]!=y)dfs(v[i],x,z);
}
inline void merge(int x,int y){
x=f[x],y=f[y];
if(size[x]>size[y])swap(x,y);
if(ca[x]&&cb[y]||cb[x]&&ca[y])ans=max(ans,lcp-1);
ca[y]|=ca[x],cb[y]|=cb[x],size[y]+=size[x];
TA[x].clear(),TB[x].clear();
add(x,y),add(y,x);
dfs(x,y,y);
}
int main(){
for(i=2;i<N;i++)Log[i]=Log[i>>1]+1;
scanf("%s%s",sa,sb);
na=strlen(sa);
nb=strlen(sb);
if(na==1||nb==1)return puts("1"),0;
for(i=0;i<na;i++)s[n++]=sa[i];
s[n++]='#';
for(i=0;i<nb;i++)s[n++]=sb[i];
for(i=0;i<n;i++)A.s[i]=B.s[n-i-1]=s[i];
A.suffixarray(n,128);
B.suffixarray(n,128);
B.build();
for(i=1;i<=n;i++){
f[i]=i,size[i]=1;
if(A.sa[i]<na){
ca[i]=1;
j=A.sa[i]-2;
if(j>=0)TA[i].insert(B.rk[n-1-j]);
}
if(A.sa[i]>na){
cb[i]=1;
j=A.sa[i]-2;
if(j>na)TB[i].insert(B.rk[n-1-j]);
}
}
for(i=1;i<n;i++)q[i]=i+1;
sort(q+1,q+n,cmp);
for(i=1;i<n;i++)lcp=A.height[q[i]],merge(q[i]-1,q[i]);
j=A.rk[1];
for(lcp=N,i=j-1;i;i--){
lcp=min(lcp,A.height[i+1]);
if(A.sa[i]>na+1)ans=max(ans,lcp);
}
for(lcp=N,i=j+1;i<=n;i++){
lcp=min(lcp,A.height[i]);
if(A.sa[i]>na+1)ans=max(ans,lcp);
}
j=A.rk[na+2];
for(lcp=N,i=j-1;i;i--){
lcp=min(lcp,A.height[i+1]);
if(A.sa[i]&&A.sa[i]<na)ans=max(ans,lcp);
}
for(lcp=N,i=j+1;i<=n;i++){
lcp=min(lcp,A.height[i]);
if(A.sa[i]&&A.sa[i]<na)ans=max(ans,lcp);
}
j=B.rk[nb+2];
for(lcp=N,i=j-1;i;i--){
lcp=min(lcp,B.height[i+1]);
if(B.sa[i]&&B.sa[i]<nb)ans=max(ans,lcp);
}
for(lcp=N,i=j+1;i<=n;i++){
lcp=min(lcp,B.height[i]);
if(B.sa[i]&&B.sa[i]<nb)ans=max(ans,lcp);
}
j=B.rk[1];
for(lcp=N,i=j-1;i;i--){
lcp=min(lcp,B.height[i+1]);
if(B.sa[i]>nb+1)ans=max(ans,lcp);
}
for(lcp=N,i=j+1;i<=n;i++){
lcp=min(lcp,B.height[i]);
if(B.sa[i]>nb+1)ans=max(ans,lcp);
}
return printf("%d",ans+1),0;
}