【题目链接】
http://www.lydsy.com/JudgeOnline/problem.php?id=3172
【题意】
题目的意思是这样的,给若干个单词,求每个单词在这一堆单词中的出现次数。 出题人语文水平高
【思路】
AC自动机. fail树
AC自动机中的fail指针指向该串的一个后缀,将fail指针反向后得到一棵fail树,利用getFail后的bfs序在树上进行DP统计出现次数。
在fail树上,父节点对应字符串是其子结点对应字符串的极大后缀。我们用sum[u]记录一个结点u被几个单词结点所经过,插入时顺便统计一下即可。设pos[i]为单词i在自动机上所对应的尾节点,那么这时候sum[pos[i]]是否为i的答案呢?不是。因为可能出现有一个字符串为abbabc,而i是abc的情况,这时候abc作为后缀出现但是并没有计数,对于结点u,我们应该将fail树上u->root路径上的所有节点的sum+=sum[u],这步操作只需要递推一下,这时候的sum[pos[i]]才是i的答案。
感觉与SAM中的p=>p->fa的思路挺像的。
【代码】
#include<cstdio>
#include<cstring>
using namespace std; const int N = 1e6+; struct ACauto {
int sz,ch[N][],sum[N],q[N],pos[N],f[N];
void init() {
sz=;
memset(ch[],,sizeof(ch[]));
}
void insert(char* s,int rank) {
int u=;
for(int i=;s[i];i++) {
int c=s[i]-'a';
if(!ch[u][c]) {
memset(ch[sz],,sizeof(ch[sz]));
ch[u][c]=sz++;
}
u=ch[u][c];
sum[u]++;
}
pos[rank]=u;
}
void get_Fail() {
int front=,rear=; //a pos for 0
f[]=; q[]=;
for(int i=,p;i<;i++)
if(p=ch[][i]) f[p]=,q[rear++]=p;
while(front!=rear) {
int qr=q[front++];
for(int c=;c<;c++) {
int u=ch[qr][c];
if(!u) continue;
q[rear++]=u; int v=f[qr];
while(v&&!ch[v][c]) v=f[v];
f[u]=ch[v][c];
}
}
for(int i=rear-;i>=;i--)
sum[f[q[i]]]+=sum[q[i]];
}
}ac; int n;
char s[N]; int main() {
scanf("%d",&n);
ac.init();
for(int i=;i<=n;i++) {
scanf("%s",s);
ac.insert(s,i);
}
ac.get_Fail();
for(int i=;i<=n;i++)
printf("%d\n",ac.sum[ac.pos[i]]);
return ;
}