ZOJ 3228 Searching the String(AC自动机)
http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=3228
题意:
给你N个模板串和一个文本串,问你这些模板串在文本串中最多出现了多少次。注意:模板串可能重复,且模板串有两种类型,第一种是:对于同一个模板,其前后匹配的位置可以重叠(即两个同样的单词前后重叠了)。第二种模板不能重叠。
分析:
首先该题的模板可以重复,不论是type1还是type0的,但是我们程序中对于每个模板不区分类型,我们直接插入到AC自动机去,但是每个单词节点有两个cnt值,cnt[0]表示该单词节点可重叠时的计数个数.cnt[1]表示该单词节点不可重叠时的计数个数.并且用time属性记录该单词节点(不可重叠那个属性)上次匹配文本串时,出现的位置.然后如果下次又匹配了文本串,就要用当前位置和time属性比较,看看两者之差是不是>=单词的长度(所以还需要一个单词节点长度属性len).这里做了贪心选择,优先选择先出现的同一个模板。
由于模板可以重复,我们这里要处理重复模板,但是我们不用map去映射,我们对于每个模板查询一次AC自动机即可.然后按照模板的类型返回它的值即可.应该比用map要快.而且简单。
具体细节还是需要看代码体会.
AC代码: 模板各种写错,不过过样例后直接AC了.
#include<iostream> #include<queue> #include<cstring> #include<cstdio> using namespace std; const int maxnode = 101000*5; const int sigma_size=26; struct AC_Automata { int ch[maxnode][sigma_size]; int val[maxnode];//表示是否是单词节点 int time[maxnode],len[maxnode];//单词节点的长度,以及上次type1的单词出现在文本串的位置+1处 int last[maxnode],f[maxnode]; int cnt[maxnode][2];//计数 int sz; void init() { sz=1; memset(ch[0],0,sizeof(ch[0])); val[0]=last[0]=f[0]=0; } void insert(char *s)//不分类型的插入单词 { int n=strlen(s),u=0; for(int i=0;i<n;i++) { int id=s[i]-'a'; if(ch[u][id]==0) { ch[u][id]=sz; memset(ch[sz],0,sizeof(ch[sz])); val[sz++]=0; } u=ch[u][id]; } val[u]=1; time[u]=0; len[u]=n; cnt[u][0]=cnt[u][1]=0; } void print(int i,int pos) { if(val[i]) { cnt[i][0]++; if(time[i]+len[i]<=pos)//判断是否有重叠 { time[i]=pos; cnt[i][1]++; } print(last[i],pos); } } void find(char *s) { int n=strlen(s),j=0; for(int i=0;i<n;i++) { int id=s[i]-'a'; while(j && ch[j][id]==0) j=f[j]; j=ch[j][id]; if(val[j]) print(j,i+1); else if(last[j]) print(last[j],i+1); } } int find_T(char *s,int type) { int n=strlen(s),u=0; for(int i=0;i<n;i++) { int id=s[i]-'a'; u=ch[u][id]; } return cnt[u][type]; } void getFail() { queue<int> q; for(int i=0;i<sigma_size;i++) { int u=ch[0][i]; if(u) { last[u]=f[u]=0; q.push(u); } } while(!q.empty()) { int r=q.front();q.pop(); for(int i=0;i<sigma_size;i++) { int u=ch[r][i]; if(!u)continue; q.push(u); int v=f[r]; while(v && ch[v][i]==0) v=f[v]; f[u]=ch[v][i]; last[u] = (val[f[u]])?f[u]:last[f[u]]; } } } }; AC_Automata ac; const int MAXN=100000+1000; char str[MAXN]; char t[MAXN][7]; int type[MAXN]; int main() { int kase=0; while(scanf("%s",str)==1) { ac.init(); int n; scanf("%d",&n); for(int i=0;i<n;i++) { scanf("%d%s",&type[i],t[i]); ac.insert(t[i]); } ac.getFail(); ac.find(str); printf("Case %d\n",++kase); for(int i=0;i<n;i++) { printf("%d\n",ac.find_T(t[i],type[i])); } printf("\n"); } return 0; }