题意:给定一些只含大写字母的病毒串,再给一个文本串,问文本串中每个病毒串各出现了多少次。
题解:
就是用AC自动机,在每个节点末尾有个id记录是哪个单词的末尾,然后如果同时是多个单词的末尾就用一个next数组链状记录当前id的下一个值。
多组数据坑死人。坑死人。
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<iostream>
#include<queue>
using namespace std; const int N=,S=,A=;
int n,num,cnt[N],nt[N],fir[N],sum[N];
char ss[N][],s[S];
queue<int> q;
struct node{
int id,fail,son[];
}a[N]; void clear(int x)
{
a[x].id=a[x].fail=;
memset(a[x].son,,sizeof(a[x].son));
} void trie(char *c,int id)
{
int x=,l=strlen(c);
for(int i=;i<l;i++)
{
int ind=c[i]-'A'+;
if(!a[x].son[ind])
{
num++;
clear(num);
a[x].son[ind]=num;
}
x=a[x].son[ind];
}
if(!a[x].id) a[x].id=id,fir[x]=id;
else nt[id]=a[x].id,a[x].id=id;
} void buildAC()
{
while(!q.empty()) q.pop();
for(int i=;i<=A;i++)
if(a[].son[i]) q.push(a[].son[i]);
while(!q.empty())
{
int x=q.front();q.pop();
int fail=a[x].fail;
for(int i=;i<=A;i++)
{
if(a[x].son[i])
{
int y=a[x].son[i],z=a[fail].son[i];
a[y].fail=z;
if(fir[y]) nt[fir[y]]=a[z].id;
else a[y].id=a[z].id;
q.push(y);
}
else a[x].son[i]=a[fail].son[i];
}
}
} void find(char *c)
{
int x=,l=strlen(c);
for(int i=;i<l;i++)
{
if(!(c[i]>='A' && c[i]<='Z')) {x=;continue;}
int ind=c[i]-'A'+;
x=a[x].son[ind];
int p=a[x].id;
while(p)
{
sum[p]++;
p=nt[p];
}
}
} int main()
{
freopen("a.in","r",stdin);
freopen("a.out","w",stdout);
while(scanf("%d",&n)!=EOF)
{
num=;
clear();
memset(nt,,sizeof(nt));
memset(fir,,sizeof(fir));
memset(sum,,sizeof(sum));
scanf("%d",&n);
for(int i=;i<=n;i++)
{
scanf("%s",ss[i]);
trie(ss[i],i);
}
buildAC();
scanf("%s",s);
find(s);
for(int i=;i<=n;i++)
if(sum[i]) printf("%s: %d\n",ss[i],sum[i]);
} return ;
}