【wikioi】1040 统计单词个数

时间:2021-10-05 11:17:46

题目链接

算法:划分型DP

PS:被卡过3天。日期:2013-10-10 ~ 2013-10-12 18:52:48

这题是我提交了13次AC= =汗= =

题目描述:

给出一个长度不超过200的由小写英文字母组成的字母串(约定;该字串以每行20个字母的方式输入,且保证每行一定为20个)。要求将此字母串分成k份(1<k<=40),且每份中包含的单词个数加起来总数最大(每份中包含的单词可以部分重叠。当选用一个单词之后,其第一个字母不能再用。例如字符串this中可包含this和is,选用this之后就不能包含th)(管理员注:这里的不能再用指的是位置,不是字母本身。比如thisis可以算做包含2个is)。
单词在给出的一个不超过6个单词的字典中。
要求输出最大的个数。

注意:

1、此题和【wikioi】1017 乘积最大  的性质差不多,都是划分k份(1017是添乘号,其实就是分k+1份)

2、唯一不同的是,判断单词是一个整体,少一个就不能加入,所以要特别注意

3、此题预处理恶心,就是在主DP前还要DP一个二维数组a,a[i][j]表示下标i->j单词数(恶心就恶心在更新这里,我是看了别人的题解的= =)

首先是主方程DP:

我们用F[n][k]来表示0到n(因为是字符串,我用string存的)划分成k份得到的数最大

得到:

F[i][1] = a[1][i]  (0 <= i < str.size())

F[i][k] = max(F[i][k], A[j+1][i]*F[j][k-1]) (k-1 <= j < i, 2 <= k <= m) //m是要分成的份数

//想想为什么是k-1而不是k? 因为是分成k份,相当于有k-1个乘号

for(int l = 2; l <= k; l++)
for(int i = l-1; i < str.size(); i++)
for(int j = i-1; j >= l-1; j--)
f[i][l] = max(f[i][l], f[j][l-1] + a[j+1][i]);

然后到初始化a数组的DP:

我们从字符串屁股找起(j=str.size()-1  -> 0),每一次设i从j到0更新a[i][j]

很容易得到方程

a[i][j] = a[i+1][j] + 1 (以i为下标找到一个单词(必须以i为单词的第一个下标))

a[i][j] = a[i+1][j]       (以i为下标找不到单词,就等于i+1->j的单词数)

//dic是存单词的,str是整个字符串
int yes, i, j, l;
for(j = str.size()-1; j >= 0; j--)
for(i = j; i >= 0; i--)
{
for(l = 0; l < s; l++)
{
yes = 0;
//其实就是看str[j]到i后面是否加了新单词,加了就直接退出(即使有相同的串,更何况不相同的了)
if(str.find(dic[l], i) == i && dic[l].size() <= j-i+1) yes = 1; //如果以i开头找到新单词
/* //也可以这样
if(str[i] == dic[l][0] && dic[l].size() <= j-i+1)
{
yes = 1;
for(int p = 0; p < dic[l].size(); p++)
if(str[i+p] != dic[l][p])
{
yes = 0; break;
}
}
*/
if(yes) break;
}
if(yes) a[i][j] = a[i+1][j]+1;
else a[i][j] = a[i+1][j];
}

总结:

1、贪心策略用错:

错:判断是否有前缀,有前缀就跳过。(贪心,因为有了前缀的话,应该用短的,将长的去掉)

正解:不需要此贪心,在dp中已包含

2、一直认为是某个点错,没考虑是整体错误

3、被数据坑得以为对,一直提交

以后多多注意= =

放上全部代码:

#include <iostream>
#include <string>
#include <cstring>
using namespace std; string str, dic[6];
bool cdic[6][6], used[6];
int a[210][210], f[210][40], k, s; void chu() //初始化a数组,a[i][j]表示下标i->j单词数
{
memset(a, 0, sizeof(a));
int yes, i, j, l;
for(j = str.size()-1; j >= 0; j--)
for(i = j; i >= 0; i--)
{
for(l = 0; l < s; l++)
{
yes = 0;
//其实就是看str[j]到i后面是否加了新单词,加了就直接退出(即使有相同的串,更何况不相同的了)
if(str.find(dic[l], i) == i && dic[l].size() <= j-i+1) yes = 1; //如果以i开头找到新单词
/* //也可以这样
if(str[i] == dic[l][0] && dic[l].size() <= j-i+1)
{
yes = 1;
for(int p = 0; p < dic[l].size(); p++)
if(str[i+p] != dic[l][p])
{
yes = 0; break;
}
}
*/
if(yes) break;
}
if(yes) a[i][j] = a[i+1][j]+1;
else a[i][j] = a[i+1][j];
}
} void dp()
{
memset(f, 0, sizeof(f));
for(int i = 0; i < str.size(); i++)
f[i][1] = a[0][i];
for(int l = 2; l <= k; l++)
for(int i = l-1; i < str.size(); i++)
for(int j = i-1; j >= l-1; j--)
f[i][l] = max(f[i][l], f[j][l-1] + a[j+1][i]);
} void print()
{
cout << f[str.size()-1][k] << endl;
} void init()
{
string temp;
int n, p;
cin >> n;
while(n--)
{
cin >> p >> k;
str = "";
while(p--)
{
cin >> temp; str += temp;
}
cin >> s;
for(int i = 0; i < s; i++)
cin >> dic[i];
chu();
dp();
print(); }
} int main()
{
init();
return 0;
}