后缀数组 POJ 1743 Musical Theme

时间:2023-03-09 21:44:50
后缀数组 POJ 1743 Musical Theme

题目链接

题意:给定n个数字,求超过5个数字的,最长的,变化相同的,不相交的重复子串

分析:男人8题中的一题!数列相邻两项做差,形成新数列,即求数列中的最长重复子串(不可相交)。

后缀数组+二分答案。假如二分得到答案L,如何知道它是可行的呢? 因为对于排序后的后缀,Lcp ( Suffix ( List [ i ] ) , Suffix ( List [ i - 1 ] ) ) 是所有与Suffix ( List [ i ] )的LCP值中最大的一个。 因为 Height [ i ] 表示的是排序后后缀数组中第i个后缀和第i-1个后缀的LCP值。 那么对于后缀数组中的一段 L - R , 若 Height [ L + 1 ] ~ Height [ R ] 全部大于等于L,那么就等价于第L到第R个后缀中任意两个后缀的LCP值都大于等于L。 那么只要取这里面相隔最远的两个后缀,若他们相距大于L,那么就是可行的。 ( 为什么不是等于L呢 ? 因为我们取的关键字是 S[i]-S[i-1] , 若相距等于L,那么两段里面的首尾相连了,是不符合条件的)

简单来说,先对height数组分段,然后看每段是否有满足题意的子串。

#include <cstdio>
#include <cstring>
#include <algorithm> const int N = 2e4 + 5;
int sa[N], rank[N], height[N];
int t[N], t2[N], c[N];
int a[N]; void da(int *s, int n, int m = 128) {
int i, p, *x = t, *y = t2;
for (i=0; i<m; ++i) c[i] = 0;
for (i=0; i<n; ++i) c[x[i]=s[i]]++;
for (i=1; i<m; ++i) c[i] += c[i-1];
for (i=n-1; i>=0; --i) sa[--c[x[i]]] = i;
for (int k=1; k<=n; k<<=1) {
for (p=0, i=n-k; i<n; ++i) y[p++] = i;
for (i=0; i<n; ++i) if (sa[i] >= k) y[p++] = sa[i] - k;
for (i=0; i<m; ++i) c[i] = 0;
for (i=0; i<n; ++i) c[x[y[i]]]++;
for (i=0; i<m; ++i) c[i] += c[i-1];
for (i=n-1; i>=0; --i) sa[--c[x[y[i]]]] = y[i];
std::swap (x, y);
p = 1; x[sa[0]] = 0;
for (i=1; i<n; ++i) {
x[sa[i]] = (y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+k]==y[sa[i]+k] ? p - 1 : p++);
}
if (p >= n) break;
m = p;
}
} void calc_height(int n) {
int i, k = 0;
for (i=0; i<n; ++i) rank[sa[i]] = i;
for (i=0; i<n; ++i) {
if (k) k--;
int j = sa[rank[i]-1];
while (a[i+k] == a[j+k]) k++;
height[rank[i]] = k;
}
} int n; bool check(int m) {
int mn = sa[0], mx = sa[0];
for (int i=1; i<n; ++i) {
if (height[i] >= m) {
mn = std::min (mn, std::min (sa[i], sa[i-1]));
mx = std::max (mx, std::max (sa[i], sa[i-1]));
if (mn + m < mx) {
return true;
}
} else {
mn = mx = sa[i];
}
}
return false;
} int main() {
while (scanf ("%d", &n) == 1) {
if (!n) break;
for (int i=0; i<n; ++i) {
scanf ("%d", a+i);
if (i) a[i-1] = a[i] - a[i-1] + 100; //做差后有负数,+100保证为正数
} if (n <= 10) {
puts ("0");
continue;
} a[n-1] = 0;
da (a, n, 200);
calc_height (n); int ans = 0;
int left = 0, right = n;
while (left <= right) {
int mid = left + right >> 1;
if (check (mid)) {
ans = std::max (ans, mid);
left = mid + 1;
} else {
right = mid - 1;
}
} if (ans >= 4) {
printf ("%d\n", ans + 1);
} else {
puts ("0");
}
}
return 0;
}